基于可解释性机器学习模型的脓毒症相关肝损伤患者预后预测

彭振康，李聃，杜迎，周垒垒，杨国辉

【作者机构】	贵州医科大学临床医学院；贵州医科大学附属医院呼吸与危重症医学科；贵州医科大学附属医院重症医学科
【分类号】	R459.7
【基金】	贵州省科技计划项目（黔科合基础-ZK[2024]一般185）贵州医科大学附属医院国家自然科学基金（NSFC）地区基金培育计划项目（gyfynsfc-2021-54）。

全文文内图表参考文献出版信息

文内图表

: 表1 训练集和验证集基线资料比较

: 表2 生存组和死亡组基线资料比较

: 图1 Boruta算法特征变量筛选

: 图2 各模型受试者操作特征曲线、DCA曲线和校准曲线

: 表3 各模型性能指标比较

: 图3 分类提升树预后模型的SHAP解释模型

基于可解释性机器学习模型的脓毒症相关肝损伤患者预后预测

彭振康1 李聃1 杜迎1 周垒垒2 杨国辉3

1.贵州医科大学临床医学院，贵州贵阳 550000；2.贵州医科大学附属医院呼吸与危重症医学科，贵州贵阳 550000；3.贵州医科大学附属医院重症医学科，贵州贵阳 550000

[摘要] 目的探讨可解释性机器学习模型预测脓毒症相关肝损伤（SALI）患者预后的应用价值。方法回顾性分析2008年1月至2022年12月MIMIC-Ⅳ（3.1版）数据库中2 414例SALI患者，按照8∶2比例将其分为训练集（1 931例）和验证集（483例）。根据患者进入ICU后28 d是否死亡将其分为死亡组和存活组。使用Boruta算法确定特征变量，构建分类提升树、极端梯度提升树、轻量梯度提升树、逻辑回归、朴素贝叶斯和支持向量机6种预后预测模型，并比较模型的预测效能。采用SHAP解释模型进行特征解释。结果训练集中670例SALI患者死亡，死亡率为34.70%。两组年龄、呼吸频率、体温、收缩压、舒张压、氧饱和度、氧合指数、白细胞计数、血红蛋白、红细胞计数、葡萄糖、红细胞体积分布宽度、平均红细胞体积、平均红细胞血红蛋白浓度、天冬氨酸转氨酶、丙氨酸转氨酶、总胆红素、尿素氮、肌酐、钠、钾、钙、镁、无机磷酸盐、碳酸氢根、阴离子间隙、乳酸、氧分压、二氧化碳分压、国际标准化比值、凝血酶原时间、活化部分凝血活酶时间（APTT）、简化急性生理学评分Ⅱ（SAPSⅡ）评分、序贯性器官功能衰竭评分、全身炎症反应综合征评分、查尔森合并症指数评分、慢性肾脏病、心力衰竭、冠心病、慢性阻塞性肺疾病、恶性肿瘤、肾脏替代治疗、有创机械通气和液体输出量比较，差异有统计学意义（P＜0.05）。Boruta算法筛选出29个特征变量用于构建预后模型。分类提升树模型表现出较理想的性能，F1评分为0.638，曲线下面积为0.814。SHAP解释模型显示SAPSⅡ评分、乳酸、液体输出量等为影响SALI患者预后的关键预测因子。结论基于机器学习的预后预测模型是预测SALI患者预后的可靠工具。SHAP模型能有效解释其决策机制，可用于临床决策，帮助临床医师优化资源分配和患者管理。

[关键词] 脓毒症相关肝损伤；MIMIC-Ⅳ数据库；机器学习

脓毒症是一种由机体对感染反应失调引起的器官功能障碍[1]。肝脏是易受累的靶器官之一，脓毒症相关肝损伤（sepsis-associated liver injury，SALI）主要包括两种亚型—脓毒症相关胆汁淤积和缺氧性肝损伤[2-3]。脓毒症相关胆汁淤积以胆红素＞34.2 μmol/L为主要特征，反映胆汁排泄障碍[4-5]；缺氧性肝损伤则表现为肝酶＞5倍正常上限，提示肝细胞结构性损伤[6-7]。多项研究表明，将上述阈值作为SALI的诊断标准具有较好的临床适用性[4,8-9]；但目前缺乏针对SALI患者的精准预后模型。基于此，本研究旨在基于机器学习算法构建SALI预后模型，以期为临床提供预后评估。

1 资料与方法

1.1 一般资料

回顾性分析2008年1月至2022年12月MIMIC-Ⅳ（3.1版）数据库[10]中2 414例SALI患者的临床资料。本研究经麻省理工学院机构审查委员会批准（68756616）。

脓毒症诊断标准符合《脓毒症和脓毒症休克的第三个国际共识定义（2016年版）》[1]；SALI诊断标准为总胆红素＞34.2 μmol/L或肝酶＞5倍正常上限[1,4]。

纳入标准：①年龄≥18岁；②首次入住ICU；③24 h内诊断为脓毒症；④ICU停留≥24 h。排除标准：①缺失肝酶和胆红素数据；②合并慢性肝病或胆道疾病。

1.2 数据提取

数据提取包括社会人口学特征（如性别、年龄、体重、心率等）、生命体征（如呼吸频率、体温、收缩压、舒张压等）、实验室指标（如白细胞计数、血红蛋白、红细胞计数、血小板计数等）、合并症（如高血压病、糖尿病、心力衰竭等）及干预措施（如肾脏替代治疗、有创机械通气等）。结局为患者进入ICU后28 d是否死亡。

1.3 研究方法

将研究对象按照8∶2的比例分为训练集（1 931例）和验证集（483例）；同时，根据患者进入ICU后28 d是否死亡将其分为生存组和死亡组。采用多重插补法对缺失数据＜20%的变量进行插补，否则剔除[11]。在训练集中，将变量纳入Boruta算法中进行特征筛选[12]。数据不平衡问题通过SMOTE过采样技术处理[13]。构建分类提升树（categorical boosting tree，CatBoost）、极端梯度提升树、轻量梯度提升树、逻辑回归、朴素贝叶斯和支持向量机6种预后模型。模型性能通过曲线下面积（area under the curve，AUC）、校准曲线、准确度、灵敏度、F1评分、精确度、特异度进行评估，决策曲线分析（decision curve analysis，DCA）评估模型的临床适用性。采用SHAP解释模型对最佳预后模型进行特征解释[14]。

1.4 统计学方法

采用DecisionLinnc 1.0统计学软件进行数据分析。不符合正态分布的计量资料采用中位数（M）和四分位数间距（Q）表示，比较采用非参数检验。计数资料用例数和百分率[例（%）]表示，比较采用χ2 检验。以P＜0.05为差异有统计学意义。

2 结果

2.1 训练集和验证集基线资料比较

训练集和验证集基线资料比较，差异无统计学意义（P＞0.05）。见表1。

表1 训练集和验证集基线资料比较

注“*”代表使用了多重插补法。MCHC：平均红细胞血红蛋白浓度；MCH：平均红细胞血红蛋白量；APTT：活化部分凝血活酶时间；SAPSⅡ：简化急性生理学评分Ⅱ；SOFA：序贯性器官功能衰竭评分；SIRS：全身炎症反应综合征评分；GCS：格拉斯哥昏迷评分；CCI：查尔森合并症指数。1 mmHg=0.133 kPa。

2.2 生存组和死亡组基线资料比较

670例SALI患者死亡，死亡率为34.70%。两组年龄、呼吸频率、体温、收缩压、舒张压、氧饱和度、氧合指数、白细胞计数、血红蛋白、红细胞计数、葡萄糖、红细胞体积分布宽度、平均红细胞体积、平均红细胞血红蛋白浓度（mean corpuscular-hemoglobin concentration，MCHC）、天冬氨酸转氨酶、丙氨酸转氨酶、总胆红素、尿素氮、肌酐、钠、钾、钙、镁、无机磷酸盐、碳酸氢根、阴离子间隙、乳酸、氧分压、二氧化碳分压、国际标准化比值、凝血酶原时间、活化部分凝血活酶时间（activated partial thromboplastin time，APTT）、简化急性生理学评分Ⅱ（simplified acute physiology score Ⅱ，SAPSⅡ）评分、序贯性器官功能衰竭评分（sequential organ failure score，SOFA）、全身炎症反应综合征评分（systemic inflammatory response syndrome score，SIRS）、查尔森合并症指数（Charson comorbidity index，CCI）评分、慢性肾脏病、心力衰竭、冠心病、慢性阻塞性肺疾病、恶性肿瘤、肾脏替代治疗、有创机械通气和液体输出量比较，差异有统计学意义（P＜0.05）。见表2。

表2 生存组和死亡组基线资料比较

2.3 预后模型特征选择

通过比较原始特征与随机生成的影子特征的重要性，运行100次最大重要性来源特征，筛选出29个特征变量用于构建预后模型。见图1。

图1 Boruta算法特征变量筛选

SAPSⅡ：简化急性生理学评分Ⅱ；SOFA：序贯性器官功能衰竭评分；APTT：活化部分凝血活酶时间；CCI：查尔森合并症指数；MCHC：平均红细胞血红蛋白浓度。

2.4 模型的构建与验证

CatBoost模型在验证集表现出较理想的性能，整体表现最优；并且CatBoost模型具有更好的临床适用性。见图2、表3。

图2 各模型受试者操作特征曲线、DCA曲线和校准曲线

A：受试者操作特征曲线；B：DCA曲线。C：校准曲线；CatBoost：分类提升树；AUC：曲线下面积；DCA：决策曲线分析。

表3 各模型性能指标比较

注CatBoost：分类提升树；AUC：曲线下面积。

2.5 解释性分析结果

影响SALI患者预后的相对重要性排序依次为SAPSⅡ评分、乳酸、液体输出量、APTT、葡萄糖、体温、呼吸频率、无机磷酸盐、平均红细胞体积、红细胞体积分布宽度、氧合指数、MCHC、尿素氮、氧饱和度、年龄，见图3A。训练集中存活个体的预测值为-1.22，较高液体输出量、较低呼吸频率及MCHC等因素降低死亡风险，见图3B。验证集存活个体的预测值为-1.00，见图3C。

图3 分类提升树预后模型的SHAP解释模型

A：SHAP蜂群图及重要性变量排序；B：SHAP模型训练集存活个体预测；C：SHAP模型验证集存活个体预测。SAPSⅡ：简化急性生理学评分Ⅱ；APTT：活化部分凝血活酶时间；MCHC：平均红细胞血红蛋白浓度。蓝色表示该特征对预测具有负向影响（箭头朝左），而红色则表示正向影响（箭头朝右）。

3 讨论

肝脏是脓毒症的常见靶器官，肝损伤可增加患者死亡风险并加速多器官功能衰竭[15]。在脓毒症中，肝脏发挥重要作用：一方面，它维护内环境的稳定；另一方面，由于过度炎症反应和免疫紊乱，肝脏自身也容易发生损伤[16]。相较于陈闪闪等[17]和Wen等[18]基于胆红素模型观察SALI患者的预后风险，本研究纳入的肝酶指标能够更有效地减少漏诊[19]。

本研究成功构建并验证SALI患者的机器学习预后模型。通过Boruta算法筛选了29个特征变量，确定CatBoost模型为最佳预后模型，并利用SHAP模型增强模型的解释性。CatBoost模型因其计算高效、预测准确度高而表现优异[20-21]。为进一步解释机器学习模型，应用SHAP模型能够清晰展示各预测因子对模型输出的影响程度及整体分布，与既往研究结果一致[22-24]。本研究中红细胞相关指标也对预后有预测价值，可能是因为肝脏受损导致造血生长因子促红细胞生成素的灭活障碍，影响红细胞凋亡与炎症调节[25]。此外，SHAP模型还通过演示CatBoost模型如何为单个样本生成预测，为临床医师提供直观的决策指导，可显著提升其对模型特定预测机制的理解。

虽然机器学习模型预测预后的变量均来自电子病历常规采集指标，并显示出较好的泛化能力；但是，本研究存在一定的局限性：①本研究未对数据库进行全面分析，如身高、白蛋白等变量存在大量缺失值，可能忽略关键变量；②回顾性研究设计可能引入选择偏倚。未来仍需进行前瞻性、多中心研究加以验证和完善。

综上所述，基于机器学习算法的SALI预后模型能有效预测患者预后，并结合SHAP模型提供可解释的支持，有望应用于临床决策，协助医师优化资源分配和疾病管理。

利益冲突声明：本文所有作者均声明不存在利益冲突。

[参考文献]

[1]SINGER M，DEUTSCHMAN C S，SEYMOUR C W，et al.The Third International Consensus Definitions for Sepsis and Septic Shock（Sepsis-3）[J].JAMA，2016，315（8）：801-810.

[2]LELUBRE C，VINCENT J L.Mechanisms and treatment of organ failure in sepsis [J].Nat Rev Nephrol，2018，14（7）：417-427.

[3]赵广明，胡占升.脓毒症肝损伤的发病机制与治疗研究进展[J].解放军医学杂志，2019，44（6）：515-520.

[4]PEREZ RUIZ DE GARIBAY A，KORTGEN A，LEONHARDT J，et al.Critical care hepatology：definitions，incidence，prognosis and role of liver failure in critically ill patients[J].Crit Care，2022，26（1）：289.

[5]汪佩文，董育玮.胆汁淤积的定义、病因及分类[J].内科理论与实践，2022，17（1）：15-23.

[6]HORVATITS T，DROLZ A，TRAUNER M，et al.Liver Injury and Failure in Critical Illness[J].Hepatology，2019，70（6）：2204-2215.

[7]WASEEM N，CHEN P H.Hypoxic Hepatitis：A Review and Clinical Update[J].J Clin Transl Hepatol，2016，4（3）：263-268.

[8]VAN DEN BROECKE A，VAN COILE L，DECRUYENAERE A，et al.Epidemiology，causes，evolution and outcome in a single-center cohort of 1116 critically ill patients with hypoxic hepatitis[J].Ann Intensive Care，2018，8（1）：15.

[9]赵云，蒋伟，郑瑞强，等.脓毒症相关肝损伤预后分析及基于机器学习方法的预测模型建立[J].实用临床医药杂志，2025，29（7）：32-37，42.

[10]JOHNSON A E W，BULGARELLI L，SHEN L，et al.MIMICIV，a freely accessible electronic health record dataset[J].Sci Data，2023，10（1）：1.

[11]熊巍，王娟，潘晗，等.多重稳健的高维缺失数据插补研究[J].统计与信息论坛，2023，38（2）：3-15.

[12]ZHOU H，XIN Y，LI S.A diabetes prediction model based on Boruta feature selection and ensemble learning[J].BMC Bioinformatics，2023，24（1）：224.

[13]石洪波，陈雨文，陈鑫.SMOTE过采样及其改进算法研究综述[J].智能系统学报，2019，14（6）：1073-1083.

[14]NING Y，ONG M E H，CHAKRABORTY B，et al.Shapley variable importance cloud for interpretable machine learning[J].Patterns（N Y），2022，3（4）：100452.

[15]KOBASHI H，TOSHIMORI J，YAMAMOTO K.Sepsis-associated liver injury：Incidence，classification and the clinical significance[J].Hepatol Res，2013，43（3）：255-266.

[16]XU X，YANG T，AN J，et al.Liver injury in sepsis：manifestations，mechanisms and emerging therapeutic strategies[J].Front Immunol，2025，16：1575554.

[17]陈闪闪，嵇金陵，潘胜男，等.脓毒症患者肝损伤风险预测模型的构建和验证[J].江苏大学学报（医学版），2025，35（1）：62-69.

[18]WEN C，ZHANG X，LI Y，et al.An interpretable machine learning model for predicting 28-day mortality in patients with sepsis-associated liver injury [J].PLoS One，2024，19（5）：e0303469.

[19]WEBER S，HELLMUTH J C，SCHERER C，et al.Liver function test abnormalities at hospital admission are associated with severe course of SARS-CoV-2 infection：a prospective cohort study[J].Gut，2021，70（10）：1925-1932.

[20]KUO P H，LI Y H，YAU H T.Development of feline infectious peritonitis diagnosis system by using CatBoost algorithm[J].Comput Biol Chem，2024，113：108227.

[21]ZHANG C，CHEN X，WANG S，et al.Using CatBoost algorithm to identify middle-aged and elderly depression，national health and nutrition examination survey 2011—2018[J].Psychiatry Res，2021，306：114261.

[22]KELLY B，O’NEILL L A.Metabolic reprogramming in macrophages and dendritic cells in innate immunity[J].Cell Res，2015，25（7）：771-784.

[23]REINFELD B I，MADDEN M Z，WOLF M M，et al.Cellprogrammed nutrient partitioning in the tumour microenvironment[J].Nature，2021，593（7858）：282-288.

[24]周叶，何龙平，齐英含，等.脓毒症性肝损伤的临床特征及危险因素分析[J].血栓与止血学，2024，30（2）：63-68.

[25]WALDEN A P，YOUNG J D，SHARPLES E.Bench to bedside：A role for erythropoietin in sepsis[J].Crit Care，2010，14（4）：227.

Prognostic prediction for patients with sepsis-related liver injury based on interpretable machine learning models

PENG Zhenkang1 LI Dan1 DU Ying1 ZHOU Leilei2 YANG Guohui3

1.School of Clinical Medicine,Guizhou Medical University,Guizhou Province,Guiyang 550000,China;2.Department of Respiratory and Critical Care Medicine,Affiliated Hospital of Guizhou Medical University,Guizhou Province,Guiyang 550000,China;3.Intensive Care Unit,Affiliated Hospital of Guizhou Medical University,Guizhou Province,Guiyang 550000,China

[Abstract] Objective To explore the application value of interpretable machine learning models in predicting the prognosis of patients with sepsis-associated liver injury (SALI).Methods A retrospective analysis was conducted on 2 414 SALI patients in the MIMIC-Ⅳ(version 3.1)database from January 2008 to December 2022.They were divided into the training set(1 931 cases) and the validation set (483 cases) in an 8∶2 ratio.Patients were divided into the death group and the survival group based on whether they died 28 days after being admitted to the ICU.The Boruta algorithm was used to select feature variables，six prognostic prediction models,namely categorical boosting tree,extreme gradient boosting tree,lightweight gradient boosting tree,logistic regression,Naive Bayes,and support vector machine were constructed,and the predictive efficacy of the models were compared.The SHAP model was used for feature interpretation.Results A total of 670 patients with SALI died in the training set,with a mortality rate of 34.70%.There were statistically significant differences between the two groups in age,respiratory rate,temperature,systolic blood pressure,diastolic blood pressure,oxygen saturation,oxygenation index,white blood cell count,hemoglobin,red blood cell count,glucose,red blood cell volume distribution width,mean corpuscular volume,mean corpuscular-hemo-globin concentration,aspartate transaminase,alanine aminotransferase,total bilirubin,urea nitrogen,creatinine,sodium,potassium,calcium,magnesium,inorganic phosphate,bicarbonate,anion gap,lactate,oxygen partial pressure,partial pressure of carbon dioxide,international normalized ratio,prothrombin time,activated partial thromboplastin time(APTT),simplified acute physiology score Ⅱ (SAPS Ⅱ)score,sequential organ failure score,systemic inflammatory response syndrome score,Charson comorbidity index score,chronic kidney disease,heart failure,coronary heart disease,chronic obstructive pulmonary disease,malignancy,renal replacement therapy,invasive mechanical ventilation,and fluid output (P＜0.05).The Boruta algorithm screened out 29 feature variables for the construction of the prognostic model.The categorical boosting tree model demonstrated relatively ideal performance,with an F1 score of 0.638 and an area under the curve of 0.814.The SHAP interpretation model showed that SAPSⅡscore,lactic acid,fluid output,etc.were key predictors affecting the prognosis of SALI patients.Conclusion Prognostic prediction models based on machine learning are reliable tools for predicting the prognosis of patients with SALI.The SHAP model can effectively explain the decision-making mechanism,aiding clinical decision-making and helping clinicians optimize resource allocation and patient management.

[Key words] Sepsis-associated liver injury;MIMIC-Ⅳdatabase;Machine learning

[中图分类号] R459.7

[文献标识码] A

[文章编号] 1673-7210（2025）12（c）-0050-07

DOI：10.20047/j.issn1673-7210.2025.36.09

[基金项目] 贵州省科技计划项目（黔科合基础-ZK[2024]一般185）；贵州医科大学附属医院国家自然科学基金（NSFC）地区基金培育计划项目（gyfynsfc-2021-54）。

[作者简介] 彭振康（1999.10-），男，贵州医科大学临床学院2023级全科医学专业在读硕士研究生；研究方向：脓毒症。

[通讯作者] 杨国辉（1966.7-），男，主任医师，硕士生导师；研究方向：脓毒症。

（收稿日期：2025-07-18）

（修回日期：2025-09-26）