详细信息
甘肃省平原风沙与黄土丘陵地区糖尿病性视网膜病变患病率调查及临床预测模型的构建
文献类型:学位论文
中文题名:甘肃省平原风沙与黄土丘陵地区糖尿病性视网膜病变患病率调查及临床预测模型的构建
作者:洪豆豆[1];
第一作者:洪豆豆
机构:[1]甘肃中医药大学;
第一机构:甘肃中医药大学
导师:刘静;甘肃中医药大学|张琦;甘肃中医药大学
授予学位:硕士
语种:中文
中文关键词:糖尿病性视网膜病变;机器学习;临床预测模型;风沙地区
年份:2024
摘要:目的:调查甘肃省平原风沙与黄土丘陵地区糖尿病性视网膜病变(Diabetic Retinopathy,DR)患病现状,并基于机器学习(Machine Learning,ML)构建两地区临床预测模型,分析其影响因素。方法:采用多阶段分层随机抽样的方法,在平原风沙与黄土丘陵地区各选取2个慢性病及其危险因素监测点,按性别、年龄(18~44岁,45~59岁和60~75岁)分层后进行抽样,共抽取1739例2型糖尿病(Type 2 Diabetes Mellitus,T2DM)人群。通过问卷调查收集T2DM人群的基本信息、生活方式、疾病家族史等;实验室检测血糖、血脂、肝肾功等;采用免散瞳眼底照相机(Canon CR-2)检查DR。采用χ2检验进行两地区不同人口学特征的患病率比较。基于甘肃省流调数据集(包括人口学信息、实验室测量等),采用随机抽样的方法对纳入的T2DM人群按照7∶3的比例生成训练集和测试集。采用递归特征消除(recursive feature elimination,RFE)法在平原风沙与黄土丘陵地区分别筛选出8、14个最优变量。选取逻辑回归(Logistic Regression,LR)、决策树(Decision Tree,DT)、支持向量机(Support Vector Machines,SVM)、随机森林(Random Forest,RF)及极端梯度提升树(e Xtreme Gradient Boosting,XGBoost)5个机器学习算法分别构建DR临床预测模型;绘制受试者工作特征(Receiver Operating Characteristic,ROC)曲线比较各模型预测效能选出最优模型;采用沙普利可加性特征解释(shapley additive explanation,SHAP)方法对模型变量进行解释说明;采用部分依赖图(Partial Dependence Plot,PDP)来表示重要特征与结局变量的之间的边际效应关系;最后对最优模型的实际应用进行说明。结果:1.本研究共纳入T2DM人群1739例,其中平原风沙地区854例,黄土丘陵地区885例。甘肃省平原风沙与黄土丘陵地区DR总患病率为23.6%,其中轻度非增殖性视网膜病变(Non-Proliferative Diabetic Retinopathy,NPDR)为5.5%,中度NPDR为14.7%,重度NPDR为2.8%,增殖性糖尿病性视网膜病变(Proliferative Diabetic Retinopathy,PDR)为0.7%;平原风沙地区DR患病率26.3%,黄土丘陵地区DR患病率21.0%(P<0.05)。2.平原风沙地区表现最好的模型为RF,训练集AUC为0.874,准确度、灵敏度、特异度分别为79.7%、21.2%、99.6%。测试集AUC为0.737,准确度、灵敏度、特异度分别为73.2%、8.1%、99.5%。黄土丘陵地区表现最好的模型为XGBoost。训练集AUC为0.899,准确度、灵敏度、特异度分别为85.6%、32.5%、99.2%。测试集AUC值0.783,准确度、灵敏度、特异度分别为80.5%、20.0%、98.1%。3.特征重要性排序中,平原风沙地区糖化血红蛋白(Glycosylated hemoglobin,Hb A1c)、糖尿病病程、心率、尿微量白蛋白及收缩压位居前列。当Hb A1c>6.0%且<9.0%时,DR预测风险升高;当糖尿病病程在8~14年时,随着病程的延长,DR预测风险增长显著,其后增长较为平缓;当心率>57次/min,且<72次/min时DR预测风险升高;当收缩压>130 mm Hg,且<140 mm Hg时,DR预测风险升高。4.特征重要性排序中,黄土丘陵地区糖尿病病程、尿微量白蛋白、血清白蛋白、血清尿素氮及Hb A1c排名靠前。当糖尿病病程在6~17年时,随着病程的延长,DR预测风险增长显著,其后增长趋于平缓;血清白蛋白水平升高,DR预测风险不断降低,在48~51和55~59 g/L时出现两段平台期;当血清尿素氮>5mmol/L、或Hb A1c>7.0%时,随着尿素氮、Hb A1c的升高,DR预测风险不断升高。结论:1.甘肃省平原风沙与黄土丘陵地区T2DM人群DR总患病率较东北、华北地区高;平原风沙地区DR患病率显著高于黄土丘陵地区。2.集成算法RF与XGBoost模型对DR临床风险评估表现出良好的预测性能。3.糖尿病病程、Hb A1c、尿微量白蛋白、血压、血清白蛋白和尿素氮是DR的重要影响因素。
参考文献:
正在载入数据...