DOI:10.20047/j.issn1673-7210.2025.36.09
中图分类号:R459.7
彭振康, 李聃, 杜迎, 周垒垒, 杨国辉
| 【作者机构】 | 贵州医科大学临床医学院; 贵州医科大学附属医院呼吸与危重症医学科; 贵州医科大学附属医院重症医学科 |
| 【分 类 号】 | R459.7 |
| 【基 金】 | 贵州省科技计划项目(黔科合基础-ZK[2024]一般185) 贵州医科大学附属医院国家自然科学基金(NSFC)地区基金培育计划项目(gyfynsfc-2021-54)。 |
脓毒症是一种由机体对感染反应失调引起的器官功能障碍[1]。肝脏是易受累的靶器官之一,脓毒症相关肝损伤(sepsis-associated liver injury,SALI)主要包括两种亚型—脓毒症相关胆汁淤积和缺氧性肝损伤[2-3]。脓毒症相关胆汁淤积以胆红素>34.2 μmol/L为主要特征,反映胆汁排泄障碍[4-5];缺氧性肝损伤则表现为肝酶>5倍正常上限,提示肝细胞结构性损伤[6-7]。多项研究表明,将上述阈值作为SALI的诊断标准具有较好的临床适用性[4,8-9];但目前缺乏针对SALI患者的精准预后模型。基于此,本研究旨在基于机器学习算法构建SALI预后模型,以期为临床提供预后评估。
回顾性分析2008年1月至2022年12月MIMIC-Ⅳ(3.1版)数据库[10]中2 414例SALI患者的临床资料。本研究经麻省理工学院机构审查委员会批准(68756616)。
脓毒症诊断标准符合《脓毒症和脓毒症休克的第三个国际共识定义(2016年版)》[1];SALI诊断标准为总胆红素>34.2 μmol/L或肝酶>5倍正常上限[1,4]。
纳入标准:①年龄≥18岁;②首次入住ICU;③24 h内诊断为脓毒症;④ICU停留≥24 h。排除标准:①缺失肝酶和胆红素数据;②合并慢性肝病或胆道疾病。
数据提取包括社会人口学特征(如性别、年龄、体重、心率等)、生命体征(如呼吸频率、体温、收缩压、舒张压等)、实验室指标(如白细胞计数、血红蛋白、红细胞计数、血小板计数等)、合并症(如高血压病、糖尿病、心力衰竭等)及干预措施(如肾脏替代治疗、有创机械通气等)。结局为患者进入ICU后28 d是否死亡。
将研究对象按照8∶2的比例分为训练集(1 931例)和验证集(483例);同时,根据患者进入ICU后28 d是否死亡将其分为生存组和死亡组。采用多重插补法对缺失数据<20%的变量进行插补,否则剔除[11]。在训练集中,将变量纳入Boruta算法中进行特征筛选[12]。数据不平衡问题通过SMOTE过采样技术处理[13]。构建分类提升树(categorical boosting tree,CatBoost)、极端梯度提升树、轻量梯度提升树、逻辑回归、朴素贝叶斯和支持向量机6种预后模型。模型性能通过曲线下面积(area under the curve,AUC)、校准曲线、准确度、灵敏度、F1评分、精确度、特异度进行评估,决策曲线分析(decision curve analysis,DCA)评估模型的临床适用性。采用SHAP解释模型对最佳预后模型进行特征解释[14]。
采用DecisionLinnc 1.0统计学软件进行数据分析。不符合正态分布的计量资料采用中位数(M)和四分位数间距(Q)表示,比较采用非参数检验。计数资料用例数和百分率[例(%)]表示,比较采用χ2 检验。以P<0.05为差异有统计学意义。
训练集和验证集基线资料比较,差异无统计学意义(P>0.05)。见表1。
表1 训练集和验证集基线资料比较
注“*”代表使用了多重插补法。MCHC:平均红细胞血红蛋白浓度;MCH:平均红细胞血红蛋白量;APTT:活化部分凝血活酶时间;SAPSⅡ:简化急性生理学评分Ⅱ;SOFA:序贯性器官功能衰竭评分;SIRS:全身炎症反应综合征评分;GCS:格拉斯哥昏迷评分;CCI:查尔森合并症指数。1 mmHg=0.133 kPa。
670例SALI患者死亡,死亡率为34.70%。两组年龄、呼吸频率、体温、收缩压、舒张压、氧饱和度、氧合指数、白细胞计数、血红蛋白、红细胞计数、葡萄糖、红细胞体积分布宽度、平均红细胞体积、平均红细胞血红蛋白浓度(mean corpuscular-hemoglobin concentration,MCHC)、天冬氨酸转氨酶、丙氨酸转氨酶、总胆红素、尿素氮、肌酐、钠、钾、钙、镁、无机磷酸盐、碳酸氢根、阴离子间隙、乳酸、氧分压、二氧化碳分压、国际标准化比值、凝血酶原时间、活化部分凝血活酶时间(activated partial thromboplastin time,APTT)、简化急性生理学评分Ⅱ(simplified acute physiology score Ⅱ,SAPSⅡ)评分、序贯性器官功能衰竭评分(sequential organ failure score,SOFA)、全身炎症反应综合征评分(systemic inflammatory response syndrome score,SIRS)、查尔森合并症指数(Charson comorbidity index,CCI)评分、慢性肾脏病、心力衰竭、冠心病、慢性阻塞性肺疾病、恶性肿瘤、肾脏替代治疗、有创机械通气和液体输出量比较,差异有统计学意义(P<0.05)。见表2。
表2 生存组和死亡组基线资料比较
注“*”代表使用了多重插补法。MCHC:平均红细胞血红蛋白浓度;MCH:平均红细胞血红蛋白量;APTT:活化部分凝血活酶时间;SAPSⅡ:简化急性生理学评分Ⅱ;SOFA:序贯性器官功能衰竭评分;SIRS:全身炎症反应综合征评分;GCS:格拉斯哥昏迷评分;CCI:查尔森合并症指数。1 mmHg=0.133 kPa。
通过比较原始特征与随机生成的影子特征的重要性,运行100次最大重要性来源特征,筛选出29个特征变量用于构建预后模型。见图1。
图1 Boruta算法特征变量筛选
SAPSⅡ:简化急性生理学评分Ⅱ;SOFA:序贯性器官功能衰竭评分;APTT:活化部分凝血活酶时间;CCI:查尔森合并症指数;MCHC:平均红细胞血红蛋白浓度。
CatBoost模型在验证集表现出较理想的性能,整体表现最优;并且CatBoost模型具有更好的临床适用性。见图2、表3。
图2 各模型受试者操作特征曲线、DCA曲线和校准曲线
A:受试者操作特征曲线;B:DCA曲线。C:校准曲线;CatBoost:分类提升树;AUC:曲线下面积;DCA:决策曲线分析。
表3 各模型性能指标比较
注CatBoost:分类提升树;AUC:曲线下面积。
影响SALI患者预后的相对重要性排序依次为SAPSⅡ评分、乳酸、液体输出量、APTT、葡萄糖、体温、呼吸频率、无机磷酸盐、平均红细胞体积、红细胞体积分布宽度、氧合指数、MCHC、尿素氮、氧饱和度、年龄,见图3A。训练集中存活个体的预测值为-1.22,较高液体输出量、较低呼吸频率及MCHC等因素降低死亡风险,见图3B。验证集存活个体的预测值为-1.00,见图3C。
图3 分类提升树预后模型的SHAP解释模型
A:SHAP蜂群图及重要性变量排序;B:SHAP模型训练集存活个体预测;C:SHAP模型验证集存活个体预测。SAPSⅡ:简化急性生理学评分Ⅱ;APTT:活化部分凝血活酶时间;MCHC:平均红细胞血红蛋白浓度。蓝色表示该特征对预测具有负向影响(箭头朝左),而红色则表示正向影响(箭头朝右)。
肝脏是脓毒症的常见靶器官,肝损伤可增加患者死亡风险并加速多器官功能衰竭[15]。在脓毒症中,肝脏发挥重要作用:一方面,它维护内环境的稳定;另一方面,由于过度炎症反应和免疫紊乱,肝脏自身也容易发生损伤[16]。相较于陈闪闪等[17]和Wen等[18]基于胆红素模型观察SALI患者的预后风险,本研究纳入的肝酶指标能够更有效地减少漏诊[19]。
本研究成功构建并验证SALI患者的机器学习预后模型。通过Boruta算法筛选了29个特征变量,确定CatBoost模型为最佳预后模型,并利用SHAP模型增强模型的解释性。CatBoost模型因其计算高效、预测准确度高而表现优异[20-21]。为进一步解释机器学习模型,应用SHAP模型能够清晰展示各预测因子对模型输出的影响程度及整体分布,与既往研究结果一致[22-24]。本研究中红细胞相关指标也对预后有预测价值,可能是因为肝脏受损导致造血生长因子促红细胞生成素的灭活障碍,影响红细胞凋亡与炎症调节[25]。此外,SHAP模型还通过演示CatBoost模型如何为单个样本生成预测,为临床医师提供直观的决策指导,可显著提升其对模型特定预测机制的理解。
虽然机器学习模型预测预后的变量均来自电子病历常规采集指标,并显示出较好的泛化能力;但是,本研究存在一定的局限性:①本研究未对数据库进行全面分析,如身高、白蛋白等变量存在大量缺失值,可能忽略关键变量;②回顾性研究设计可能引入选择偏倚。未来仍需进行前瞻性、多中心研究加以验证和完善。
综上所述,基于机器学习算法的SALI预后模型能有效预测患者预后,并结合SHAP模型提供可解释的支持,有望应用于临床决策,协助医师优化资源分配和疾病管理。
利益冲突声明:本文所有作者均声明不存在利益冲突。
[1]SINGER M,DEUTSCHMAN C S,SEYMOUR C W,et al.The Third International Consensus Definitions for Sepsis and Septic Shock(Sepsis-3)[J].JAMA,2016,315(8):801-810.
[2]LELUBRE C,VINCENT J L.Mechanisms and treatment of organ failure in sepsis [J].Nat Rev Nephrol,2018,14(7):417-427.
[3]赵广明,胡占升.脓毒症肝损伤的发病机制与治疗研究进展[J].解放军医学杂志,2019,44(6):515-520.
[4]PEREZ RUIZ DE GARIBAY A,KORTGEN A,LEONHARDT J,et al.Critical care hepatology:definitions,incidence,prognosis and role of liver failure in critically ill patients[J].Crit Care,2022,26(1):289.
[5]汪佩文,董育玮.胆汁淤积的定义、病因及分类[J].内科理论与实践,2022,17(1):15-23.
[6]HORVATITS T,DROLZ A,TRAUNER M,et al.Liver Injury and Failure in Critical Illness[J].Hepatology,2019,70(6):2204-2215.
[7]WASEEM N,CHEN P H.Hypoxic Hepatitis:A Review and Clinical Update[J].J Clin Transl Hepatol,2016,4(3):263-268.
[8]VAN DEN BROECKE A,VAN COILE L,DECRUYENAERE A,et al.Epidemiology,causes,evolution and outcome in a single-center cohort of 1116 critically ill patients with hypoxic hepatitis[J].Ann Intensive Care,2018,8(1):15.
[9]赵云,蒋伟,郑瑞强,等.脓毒症相关肝损伤预后分析及基于机器学习方法的预测模型建立[J].实用临床医药杂志,2025,29(7):32-37,42.
[10]JOHNSON A E W,BULGARELLI L,SHEN L,et al.MIMICIV,a freely accessible electronic health record dataset[J].Sci Data,2023,10(1):1.
[11]熊巍,王娟,潘晗,等.多重稳健的高维缺失数据插补研究[J].统计与信息论坛,2023,38(2):3-15.
[12]ZHOU H,XIN Y,LI S.A diabetes prediction model based on Boruta feature selection and ensemble learning[J].BMC Bioinformatics,2023,24(1):224.
[13]石洪波,陈雨文,陈鑫.SMOTE过采样及其改进算法研究综述[J].智能系统学报,2019,14(6):1073-1083.
[14]NING Y,ONG M E H,CHAKRABORTY B,et al.Shapley variable importance cloud for interpretable machine learning[J].Patterns(N Y),2022,3(4):100452.
[15]KOBASHI H,TOSHIMORI J,YAMAMOTO K.Sepsis-associated liver injury:Incidence,classification and the clinical significance[J].Hepatol Res,2013,43(3):255-266.
[16]XU X,YANG T,AN J,et al.Liver injury in sepsis:manifestations,mechanisms and emerging therapeutic strategies[J].Front Immunol,2025,16:1575554.
[17]陈闪闪,嵇金陵,潘胜男,等.脓毒症患者肝损伤风险预测模型的构建和验证[J].江苏大学学报(医学版),2025,35(1):62-69.
[18]WEN C,ZHANG X,LI Y,et al.An interpretable machine learning model for predicting 28-day mortality in patients with sepsis-associated liver injury [J].PLoS One,2024,19(5):e0303469.
[19]WEBER S,HELLMUTH J C,SCHERER C,et al.Liver function test abnormalities at hospital admission are associated with severe course of SARS-CoV-2 infection:a prospective cohort study[J].Gut,2021,70(10):1925-1932.
[20]KUO P H,LI Y H,YAU H T.Development of feline infectious peritonitis diagnosis system by using CatBoost algorithm[J].Comput Biol Chem,2024,113:108227.
[21]ZHANG C,CHEN X,WANG S,et al.Using CatBoost algorithm to identify middle-aged and elderly depression,national health and nutrition examination survey 2011—2018[J].Psychiatry Res,2021,306:114261.
[22]KELLY B,O’NEILL L A.Metabolic reprogramming in macrophages and dendritic cells in innate immunity[J].Cell Res,2015,25(7):771-784.
[23]REINFELD B I,MADDEN M Z,WOLF M M,et al.Cellprogrammed nutrient partitioning in the tumour microenvironment[J].Nature,2021,593(7858):282-288.
[24]周叶,何龙平,齐英含,等.脓毒症性肝损伤的临床特征及危险因素分析[J].血栓与止血学,2024,30(2):63-68.
[25]WALDEN A P,YOUNG J D,SHARPLES E.Bench to bedside:A role for erythropoietin in sepsis[J].Crit Care,2010,14(4):227.
Prognostic prediction for patients with sepsis-related liver injury based on interpretable machine learning models
X