基于可解释性机器学习构建脑卒中患者下肢深静脉血栓形成风险预测模型

夏爱芳, 孙善斌, 陈冲, 江颖子, 王婷, 吴炳坤, 李春标, 梁月光

【作者机构】 安徽中医药大学第二附属医院康复科; 安徽中医药大学第二附属医院脑病科; 安徽中医药大学第二附属医院护理部; 安徽中医药大学第二附属医院老年科; 安徽中医药大学护理学院
【分 类 号】 R743.3
【基    金】 国家优势专科康复科建设项目(国中医药医政函〔2024〕90号) 安徽省省级临床重点专科建设项目(皖卫医秘〔2022〕105号) 安徽省高等学校科学研究项目(2023AH050804)。
全文 文内图表 参考文献 出版信息
基于可解释性机器学习构建脑卒中患者下肢深静脉血栓形成风险预测模型

基于可解释性机器学习构建脑卒中患者下肢深静脉血栓形成风险预测模型

夏爱芳1 孙善斌1 陈 冲1 江颖子2 王 婷3 吴炳坤4 李春标5 梁月光1

1.安徽中医药大学第二附属医院康复科,安徽合肥 230001;2.安徽中医药大学第二附属医院脑病科,安徽合肥 230001;3.安徽中医药大学第二附属医院护理部,安徽合肥 230001;4.安徽中医药大学第二附属医院老年科,安徽合肥 230001;5.安徽中医药大学护理学院,安徽合肥 230012

[摘要] 目的 探讨可解释性机器学习在预测脑卒中患者下肢深静脉血栓形成(DVT)风险的价值,为临床预防DVT提供参考。方法 回顾性收集2021年1月至2025年4月于安徽中医药大学第二附属医院就诊的450例脑卒中患者的临床数据,经单因素分析和LASSO回归筛选变量后,将数据按8∶2拆分为训练集和验证集,并运用决策树、极限梯度提升算法、支持向量机、轻量级梯度提升机算法(LightGBM)、K-近邻算法5种机器学习方法在训练集构建模型,通过5折交叉验证对模型参数调优。在验证集上,曲线下面积、准确度、灵敏度等指标评估各模型性能,选取最优模型。最后运用Shapley加性解释(SHAP)算法对最优模型进行可解释性分析。结果 本研究中DVT的发生率为13.56%。通过单因素分析和LASSO回归筛选出9个变量:脑卒中类型、脱水剂、苔色、年龄、日常生活能力量表(ADL)评分、血红蛋白、血小板计数、血肌酐、D-二聚体。在5种机器学习模型中表现最优为LightGBM模型(验证集AUC:0.903,准确度:0.857,精确度:0.971,F1分数:0.912)。SHAP算法分析结果显示,对预测脑卒中患者发生下肢DVT的贡献度排名前5位的特征为D-二聚体、ADL评分、苔色、血肌酐、血红蛋白。结论 使用LightGBM构建的预测模型表现较佳,有助于临床工作者识别高危DVT风险的患者;D-二聚体、ADL评分等指标对预测脑卒中患者发生DVT有重要指导意义,可为DVT的预防提供一定的参考。

[关键词] 脑卒中;深静脉血栓形成;机器学习;预测模型;Shapley加性解释

脑卒中是一种急性脑血管疾病,具有高发病率、高死亡率和高致残率的特点[1]。深静脉血栓形成(deep vein thrombosis,DVT)是脑卒中患者常见的一种并发症,其发病率在13.2%~80.0%,具体取决于所使用的诊断方法、评估时机等因素[2-5]。如果DVT未得到及时干预,可能会引发肺栓塞,增加患者致残和死亡风险[6-7]。因此,及时识别脑卒中患者发生DVT的高危因素对于改善患者的预后至关重要。风险预测模型是一种利用数学公式预测疾病或结局事件发生概率的工具,有助于识别高危患者并优化治疗[8-9]。机器学习作为人工智能的一个重要分支,在风险预测模型领域展现出了强大的潜力[10-11]。既往的研究[12-13]已证实机器学习方法能够构建更加精准的风险预测模型,但针对脑卒中患者发生DVT的机器学习模型仍较少见。除此之外,机器学习方法决策过程不透明的“黑箱”特性限制了其在临床的应用。为解决此问题,Lundberg等[14]提出了一个解释预测的统一框架,即Shapley加性解释(Shapley additive explanation,SHAP)。SHAP能够衡量特征对预测结果的贡献,并进行全局解释和局部解释,便于模型理解和应用。本研究旨在基于机器学习方法构建脑卒中患者DVT风险预测模型,并使用SHAP算法对模型进行解释,为预防脑卒中患者DVT提供参考。

1 资料与方法

1.1 一般资料

本研究回顾性收集2021年1月至2025年4月就诊于安徽中医药大学第二附属医院的450例脑卒中患者作为研究对象。纳入标准:①通过CT、MRI等影像学检查确诊为脑卒中;②通过下肢超声静脉血栓诊断为DVT;③年龄≥18岁。排除标准:①住院时间<3 d;②入院前已存在DVT;③合并严重肝肾功能障碍、恶性肿瘤、恶性血液系统疾病等严重器质性疾病;④数据的缺失比例>30%。本研究已通过安徽中医药大学第二附属医院伦理委员会审查(2025-zjmc-06)。

1.2 数据收集

收集电子病历系统中符合研究标准的患者数据,包括①患者基本信息:性别、年龄、体重指数、入院及出院时间;②疾病特征:入院时日常生活能力量表(activity of daily living scale,ADL)[15]评分、脑卒中类型、下肢肌力;③既往史:糖尿病史、高血压病史、心脏疾病史、吸烟史、饮酒史、下肢骨折或手术史;④疾病治疗因素:溶栓药物、脱水剂;⑤中医指标:苔色;相关指标的诊断标准参照《中医诊断学》[16]、《中风病诊断与疗效评定标准(试行)》[17];⑥实验室化验指标(入院24 h内检测):血红蛋白、血小板计数、血肌酐、甘油三酯、低密度脂蛋白、纤维蛋白原、D-二聚体。

1.3 数据预处理

连续性变量均保留原始形式输入,分类变量进行独热编码处理。当某个变量的缺失值<30%时,采用R软件mice程序包的随机森林法对数据进行插补,插补次数为5次,通过观察插补前后数据分布的密度图以评估插补的结果。

1.4 模型的构建和评价

1.4.1 变量筛选 对数据进行单因素分析,选取其中差异有统计学意义(P<0.05)的变量进入LASSO回归中进一步筛选构建模型的变量,并进行10折交叉验证,选择Lambda 1se作为模型的最佳Lambda值。

1.4.2 模型的构建 将数据按照8∶2的比例随机划分为训练集(359例)和验证集(91例)。使用以下5种机器学习算法在训练集中构建模型:决策树(decision tree,DT)、极限梯度提升算法(extreme gradient boosting,XGBoost)、支持向量机(support vector machine,SVM)、轻量级梯度提升机算法(light gradient boosting machine,LightGBM)、K-近邻算法(K-nearest neighbor classification,KNN)。训练集采用5折交叉验证对模型进行训练,同时采用网格搜索对模型的超参数进行调优,以寻找最优的参数组合,进一步提高模型的预测性能。

1.4.3 模型的性能评价与解释 在验证集通过受试者操作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under the curve,AUC)评价模型的区分度,并计算模型的准确度、灵敏度、特异度等指标以综合评估模型的性能并选出表现最优的模型。最后采用SHAP方法对预测性能表现最优的模型进行解释,根据每个特征的SHAP值对特征的重要性进行排序,SHAP值越大,提示该特征对预测结局的贡献度越大[14]

1.5 统计学方法

使用R 4.3.0统计学软件进行数据分析。符合正态分布的计量资料用均数±标准差()表示,比较采用t检验;不符合正态分布的计量资料采用中位数(M)和四分位数(P25,P75)表示,比较采用Mann-Whitney U检验。计数资料以例数和百分率表示,比较采用χ2 检验。以P<0.05为差异有统计学意义。

2 结果

2.1 数据缺失情况

本研究共有7个变量存在缺失值,包括舌色(9例,2%)、苔色(10例,2.22%)、下肢肌力(27例,6.00%)、体重指数(8例,1.78%)、纤维蛋白原(17例,3.78%)、D-二聚体(49例,10.89%)、住院时间(24例,5.33%)。所有缺失值均采用随机森林法进行插补。密度图显示,插补结果与原数据的分布类型较相似。

2.2 两组基本资料比较

两组年龄、性别、住院时间、ADL评分、脑卒中类型下肢肌力、下肢骨折或手术史、血红蛋白、血小板计数、血肌酐、低密度脂蛋白、纤维蛋白原、D-二聚体比较,差异有统计学意义(P<0.05)。见表1。

表1 DVT组和非DVT组患者基本资料比较

注DVT:深静脉血栓形成;ADL:日常生活能力量表。

2.3 训练集和验证集基本资料比较

训练集与验证集基本资料比较,差异无统计学意义(P>0.05)。见表2。

表2 训练集和验证集基本资料比较

注ADL:日常生活能力量表。

2.4 变量筛选结果

将所有变量的单因素分析中差异有统计学意义(P<0.05)的变量纳入LASSO回归中进一步对变量进行筛选。最终纳入的变量为脑卒中类型、脱水剂、苔色、年龄、ADL评分、血红蛋白、血小板计数、血肌酐、D-二聚体。LASSO回归筛选变量的过程见图1。

图1 LASSO回归筛选变量

A:Lambda与偏回归系数;B:不同Lambda下的偏差。

2.5 模型的性能评价

在训练集中使用5种机器学习方法构建模型并在验证集中评价。验证集ROC曲线结果显示,Light-GBM模型的AUC值(0.903)最高,见图2。对各个模型的预测性能进行综合比较,结果显示LightGBM验证集的表现较佳,见表3。

图2 验证集ROC曲线

DT:决策树;KNN:K-近邻算法;lightGBM:轻量级梯度提升算法;SVM:支持向量机;ROC:受试者操作特征。

表3 5种机器学习模型的性能指标比较

注DT:决策树;KNN:K-近邻算法;lightGBM:轻量级梯度提升算法;SVM:支持向量机。

2.6 模型的解释

综合评估模型的区分度、预测精度等指标,得出LightGBM模型的性能表现最佳。基于SHAP对LightGBM模型进行可解释分析,并绘制蜂群图以及特征重要性排序图。在SHAP蜂群图中SHAP值>0表示该特征对预测结果有正向影响,SHAP值<0表示负向影响,图中颜色深浅反映了特征值的取值大小,见图3。将特征的重要性按照SHAP平均值进行排序,结果显示,D-二聚体的平均SHAP值(2.685)最高,对DVT预测贡献度最大,见图4。

图3 SHAP蜂群图

SHAP:Shapley加性解释;ADL:日常生活能力量表。

图4 特征重要性排序图

ADL:日常生活能力量表。

3 讨论

本研究构建的LightGBM模型表现优异,能够较好地区分脑卒中患者中发生DVT的高危人群。与其他模型相比,LightGBM模型在计算速度、内存消耗等方面都显著提高了性能[18]。使用LightGBM模型可在患者入院早期对其进行DVT风险评估,帮助医护人员识别高危患者,从而制订针对性的预防措施。

SHAP分析结果显示,对预测结局贡献度排名前5位的特征为:D-二聚体、ADL评分、苔色、血肌酐、血红蛋白。D-二聚体是纤维蛋白溶解的标志物,其升高提示体内存在活跃的凝血过程[19]。研究显示,D-二聚体对诊断缺血性脑卒中患者发生DVT的准确率高达93.9%[20]。然而,D-二聚体对诊断DVT的特异性较低,当患者手术后、处于孕期或合并恶性肿瘤等情况时,同样会使D-二聚体水平升高[21]。因此该指标在临床应用中需结合患者的具体情况进行综合评估。

另一有效预测DVT的特征为ADL评分。ADL评分降低常提示患者日常生活能力下降,Engbers等 [22]报道,日常生活活动受限可增加2.9倍的血栓形成风险。此外,有研究显示,ADL评分降低与患者肢体功能降低、活动度降低、血液黏稠度增加有关,而这些因素都会增加DVT的发生风险[23]

本研究表明,苔色是预测DVT的重要特征。苔薄(少苔)多见于血瘀质患者,而中医理论认为“血瘀”与血液高凝状态相关,其可损伤脉络、激活凝血因子,加速血栓的形成[24-25]。黄苔和腻苔多见于痰湿证患者,其发生提示湿浊阻碍气血,导致血液瘀滞,且痰证与纤维蛋白原参与的炎症反应密切相关,而纤维蛋白原升高提示高凝状态,易引发DVT[26-28]

血肌酐通常是衡量肾功能的重要指标,而Wang等[29]研究显示,肾功能受损可提示机体血流动力学的紊乱。肾功能受损发生血栓的可能机制包括凝血因子水平升高、内源性抗凝物质减少及纤维蛋白溶解活性降低[30]。此外,本研究显示,低血红蛋白水平的患者更容易发生DVT,与现有研究[31]结果一致。低血红蛋白水平常提示患者存在贫血,而贫血可能会使患者的活动量下降,导致血液流速变慢,进而发生DVT[32]

本研究仍存在一定的不足之处,首先,本研究研究中心单一,且未进行外部验证,可能会影响模型的外推性;其次,部分数据存在缺失值,可能会影响模型的性能表现。后续研究应基于上述局限性不断完善,开展多中心、前瞻性的研究,并开展外部验证,以评估模型在不同人群和环境下的表现。

综上所述,本研究通过使用5种机器学习方法构建了脑卒中患者下肢DVT风险预测模型,结果显示,LightGBM模型表现最优。SHAP结果显示,对预测DVT的影响最大的5个特征为:D-二聚体、ADL评分、苔色、血肌酐、血红蛋白。本研究构建的模型具有较好的预测性能,可为临床早期识别DVT高危患者提供参考。

作者贡献声明:夏爱芳提出主要研究目标,负责研究的构思与设计,研究的实施;夏爱芳负责论文撰写;陈冲、王婷、梁月光负责数据的收集与整理;李春标负责统计学处理,图、表的绘制与展示;孙善斌、江颖子、吴炳坤负责文章的质量控制与审查,对文章整体负责,监督管理。

利益冲突声明:本文所有作者均声明不存在利益冲突。

[参考文献]

[1] FEIGIN V L,STARK B A,JOHNSON C O,et al.Global,regional,and national burden of stroke and its risk factors,1990-2019:a systematic analysis for the Global Burden of Disease Study 2019[J].Lancet Neurol,2021,20(10):795-820.

[2] KAMPHUISENPW,AGNELLI G,SEBASTIANELLI M.Prevention of venous thromboembolism after acute ischemic stroke[J].J Thromb Haemost,2005,3(6):1187-1194.

[3] HUANG Y,GUO C,SONG K,et al.Association of clinical and laboratory variables with in-hospital incidence of deep vein thrombosis in patients after acute ischemic stroke:A retrospective study[J].Medicine(Baltimore),2021,100(6):e24601.

[4] LI F,WEI C,HUO S,et al.Predictors of deep-vein thrombosis for acute stroke at admission to a rehabilitation unit:A retrospective study[J].Front Neurol,2023,14:1137485.

[5] 李晶,孟亚楠,李晶晶,等.脑卒中患者住院康复期间发生下肢深静脉血栓的危险因素分析[J].血管与腔内血管外科杂志,2024,10(10):1207-1210.

[6] KABEIL M S,DROZ N,MOUAWAD N J,et al.Vascular Surgeon Involvement in Pulmonary Embolism Response Teams:Barriers,Challenges,Concerns and the Imperative for Integration[J].Ann Vasc Surg,2024,109:326-337.

[7] KIM H J,JEONG S,SONG J,et al.Risk of pulmonary embolism and deep vein thrombosis foll owing COVID-19:a nationwide cohort study[J].MedComm,2024,5(7):e655.

[8] 谷鸿秋,周支瑞,章仲恒,等.临床预测模型:基本概念、应用场景及研究思路[J].中国循证心血管医学杂志,2018,10(12):1454-1456,1462.

[9] RANSTAM J,COOK J A,COLLINS G S.Clinical prediction models[J].Br J Surg,2016,103(13):1886.

[10] RAVI D,WONG C,DELIGIANNI F,et al.Deep Learning for Health Informatics[J].IEEE J Biomed Health Inform,2017,21(1):4-21.

[11] 黄光成,周良,石建伟,等.机器学习算法在疾病风险预测中的应用与比较[J].中国卫生资源,2020,23(4):432-436.

[12] LIU H,YUAN H,WANG Y,et al.Prediction of venous thromboembolism with machine learning techniques in youngmiddle-aged inpatients[J].Sci Rep,2021,11(1):12868.

[13] RYAN L,MATARASO S,SIEFKAS A,et al.A Machine Learning Approach to Predict Deep Venous Thrombosis Among Hospitalized Patients [J].Clin Appl Thromb,2021,27:1076029621991185.

[14] LUNDBERG S M,LEE S I.A unified approach to interpreting model predictions [C]//Proceedings of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY,USA:Curran Associates Inc,2017:4768-4777.

[15] COLLIN C,WADE D T,DAVIES S,et al.The Barthel ADL Index:A reliability study [J].Int Disabil Stud,1988,10(2):61-63.

[16] 何建成.中医诊断学[M].北京:人民卫生出版社,2017.

[17] 李平,吴仲璇,张云如,等.中风病诊断与疗效评定标准(试行)[J].北京中医药大学学报,1996(1):55-56.

[18] KOBAYASHI Y,YOSHIDA K.Quantitative structureproperty relationships for the calculation of the soil adsorption coefficient using machine learning algorithms with calculated chemical properties from open-source software [J].Environ Res,2021,196:110363.

[19] ZHAO Y,CHENG Y,WANG H,et al.The Legend score synthesizes Wells,PERC,Geneva,D-dimer and predicts acute pulmonary embolism prior to imaging tests [J].Pulmonology,2025,31(1):2416828.

[20] 曹闻亚,常红.Padua评分联合血清D-二聚体早期预测急性期缺血性脑卒中病人深静脉血栓形成的分析[J].护理研究,2019,33(16):2841-2844.

[21] 中华医学会外科学分会血管外科学组.深静脉血栓形成的诊断和治疗指南(第三版)[J].中国血管外科杂志(电子版),2017,9(4):250-257.

[22] ENGBERS M J,BLOM J W,CUSHMAN M,et al.Functional Impairment and Risk of Venous Thrombosis in Older Adults[J].J Am Geriatr Soc,2017,65(9):2003-2008.

[23] NAKANISHI K,KANDA T,KOBATA T,et al.New score including daily life independence levels with dementia is associated with the onset of deep vein thrombosis in frail older adults[J].Geriatr Gerontol Int,2020,20(5):414-421.

[24] 段梦遥,毛伯,周恒宇,等.不同中医体质类型的舌象特征定量分析[J].中华中医药杂志,2023,38(10):4955-4958.

[25] CHEN Y,ZHANG Y.Interpretation of the pathological mechanism of blood stasis in traditional Chinese medicine in light of understanding of hypercoagulable states in modern medicine[J].Chin Med Nat Prod,2025,5(1):e30-e34.

[26] 辛小红,张星平,邓宁,等.黄苔主病之常与变[J].中医药导报,2020,26(9):66-68.

[27] 王庆盛,高慧,冯晓,等.痰湿证舌诊特征的现代研究初探[J].时珍国医国药,2021,32(8):1945-1947.

[28] 刘先璐,刘悦,王洋,等.基于多元统计的痰证相关客观指标本质分析[J].辽宁中医杂志,2020,47(5):8-12.

[29] WANGD,FANG,LIUX,et al.RenalInsufficiencyandShort-Term Outcomes of Acute Pulmonary Embolism:A Systemic Review and Meta-Analysis[J].Thromb Haemost,2020,120(7):1025-1034.

[30] JANUS N,MAHÉ I,LAUNAY-VACHER V,et al.Renal function and venous thromboembolic diseases [J].J Mal Vasc,2016,41(6):389-395.

[31] 刘奋飞,刘东平,李建明.血红蛋白水平对上肢骨折患者深静脉血栓形成的影响[J].广州医药,2023,54(2):64-69.

[32] 乔梁,姚尧,吴登先,等.贫血对人工全髋关节置换术患者围术期下肢深静脉血栓形成的影响[J].中国修复重建外科杂志,2024,38(5):570-575.

A risk prediction model for deep vein thrombosis in the lower extremities of stroke patients based on interpretable machine learning

XIA Aifang1 SUN Shanbin1 CHEN Chong1 JIANG Yingzi2 WANG Ting3 WU Bingkun4 LI Chunbiao5 LIANG Yueguang1

1.Department of Rehabilitation,the Second Affiliated Hospital of Anhui University of Chinese Medicine,Anhui Province,Hefei 230001,China;2.Department of Encephalopathy,the Second Affiliated Hospital of Anhui University of Chinese Medicine,Anhui Province,Hefei 230001,China;3.Department of Nursing,the Second Affiliated Hospital of Anhui University of Chinese Medicine,Anhui Province,Hefei 230001,China;4.Department of Geriatrics,the Second Affiliated Hospital of Anhui University of Chinese Medicine,Anhui Province,Hefei 230001,China;5.School of Nursing,Anhui University of Chinese Medicine,Anhui Province,Hefei 230012,China

[Abstract] Objective To investigate the potential of interpretable machine learning in assessing the risk of lower extremity deep vein thrombosis (DVT) in stroke patients and to offer a reference for the clinical prevention of DVT.Methods The clinical data of 450 stroke patients at the Second Affiliated Hospital of Anhui University of Traditional Chinese Medicine from January 2021 to April 2025 were retrospectively analyzed.Following variable screening using univariate analysis and LASSO regression,the dataset was partitioned into a training set and a validation set in an 8∶2 ratio.Five machine learning algorithms—decision tree,extreme gradient boosting,support vector machine,light gradient boosting machine (LightGBM),and K-nearest neighbor classification were employed to construct predictive models on the training set.Model parameters were optimized via 5-fold cross-validation.On the validation set,the performance of each model was evaluated by indicators such as the area under the curve,accuracy,and sensitivity,and the optimal model was selected.Finally,the interpretability of the selected model was evaluated using the Shapley additive explanation (SHAP) algorithm.Results The incidence of DVT in this study was 13.56%.Univariate analysis and LASSO regression identified nine variables as significant predictors: stroke type,dehydrating agent,coating color,age,activities of daily living(ADL)score,hemoglobin level,platelet count,serum creatinine,and D-dimer.Among the five machine learning models evaluated,the LightGBM model demonstrated the best performance with an AUC of 0.903,accuracy of 0.857,precision of 0.971,and F1 score of 0.912.Furthermore,SHAP algorithm analysis revealed that the top five features contributing to the prediction of lower extremity DVT in stroke patients were D-dimer,ADL score,coating color,serum creatinine,and hemoglobin level.Conclusion The prediction model constructed using LightGBM has a good performance,which is helpful for clinicians to identify patients at high risk of DVT.D-dimer,ADL score and other indicators have important guiding significance in predicting the occurrence of DVT in stroke patients,which can provide certain reference for the prevention of DVT.

[Key words] Stroke;Deep vein thrombosis;Machine learning;Prediction model;Shapley additive explanation

[中图分类号] R743.3

[文献标识码] A

[文章编号] 1673-7210(2025)08(c)-0034-07

DOI:10.20047/j.issn1673-7210.2025.24.07

[基金项目] 国家优势专科康复科建设项目(国中医药医政函〔2024〕90号);安徽省省级临床重点专科建设项目(皖卫医秘〔2022〕105号);安徽省高等学校科学研究项目(2023AH050804)。

[通讯作者] 孙善斌(1966-),男,主任医师,硕士生导师;研究方向:针灸临床应用及机制。

(收稿日期:2025-04-24)

(修回日期:2025-06-25)

X