DOI:10.20047/j.issn1673-7210.2025.29.37
中图分类号:R197.324
彭东阁, 陈晓静, 万子叶, 杨鹏程, 张阳, 卢宁
| 【作者机构】 | 新疆医科大学研究生院; 中国人民解放军新疆军区总医院; 海南医科大学国际护理学院 |
| 【分 类 号】 | R197.324 |
| 【基 金】 | 新疆维吾尔自治区科学技术厅“天山英才”科技创新领军人才项目(2023TSYCLJ0040)。 |
随着大语言模型(large language model,LLM)的快速发展,诸如OpenAI的ChatGPT和Google的Gemini等模型在临床决策支持和科研等领域展现出巨大潜力。然而,这些模型的闭源架构、高昂的计算成本及对专业医疗场景适应性不足,成为其大规模应用的主要障碍[1-2]。2025年1月20日,杭州深度求索人工智能基础技术研究有限公司发布的模型DeepSeek(R1),因其高性能、低成本和开源特性引起广泛关注。
据统计,中国的恶性肿瘤新发病例和死亡病例数量长期位居全球首位[3]。随着诊疗技术的进步,恶性肿瘤逐渐成为一种慢性疾病[4]。然而,在临床实践中,肿瘤诊治仍面临诸多挑战,包括多源数据的有效整合、决策过程的复杂性及医学知识的快速更新[5-6]。这些因素显著增加临床医师在应对复杂病例和满足患者多样化需求时的决策难度,亟须更高效的临床决策系统优化诊疗流程。DeepSeek(R1)模型凭借其强大的数据处理和模式识别能力,成为处理复杂医疗数据的重要工具[7]。本文系统阐述DeepSeek(R1)模型本地化部署架构,结合新疆军区总医院的实践案例验证其有效性。
尽管部分大语言模型已支持医学问答与对话任务,但其在专科数据融合、动态知识追溯及合规部署方面仍缺乏实践验证[8-9]。DeepSeek(R1)支持完整离线部署,可在无互联网环境下本地运行,提升模型调用的稳定性与数据的隐私保护水平[10-11]。本文采用DeepSeek(R1)70B模型与LLM及检索增强生成(retrieval en han-cement generation,RAG)技术实现低成本的模型本地化部署。模型以本地服务器为载体,融合电子病历(electronic medical record,EMR)系统、实验室信息系统(laboratory information system,LIS)与影像归档和通信系统(picture archiving and communication system,PACS)等多源信息,构建统一的多模态输入通道,实现结构化病历特征提取与个体化诊疗建模。基于此,利用新疆军区总医院脱敏数据对模型进行微调,并通过LangChain框架将模型与肿瘤科的专病数据库相连接,成功构建面向肿瘤场景的高效智能决策支持系统。
基于医疗场景的特殊性(如数据敏感性、专业术语复杂性),系统架构设计需兼顾安全性、专业性和高效性。结合医疗需求,设计以下四层架构,见图1。
图1 基于DeepSeek(R1)的肿瘤智能系统分层架构设计
1.1.1 数据层 数据层整合医院EMR、PACS、LIS及结构化医学文献库。根据原始数据存储来源,数据层可分为数据库数据和文本数据。数据层通过ETL工具和API对接医院现有系统,采用去标识化与差分隐私技术保障患者隐私,结合FHIR标准实现数据格式统一,并利用LangChain框架实现跨系统数据融合,以更好地适应医院的实际应用场景。
1.1.2 逻辑层 逻辑层由医学知识图谱、规则引擎及意图分类模块组成,负责解析用户意图,结合医学知识生成精准的推理逻辑;同时支持多模态输入,以提高系统对问题的理解深度和生成答案的精确度。此外,规则引擎集成临床诊疗路径、药品使用规范、医院管理流程等业务规则,通过Drools框架实现实时合规性校验,确保系统生成的回答符合临床规范。例如,根据患者过敏史自动过滤禁忌药物。意图分类模块采用BiLSTM-CRF模型,将医师输入的自然语言进行分类。
1.1.3 计算层 计算层负责执行核心算法与业务处理,其主要任务由DeepSeek(R1)模型提供的自然语言处理功能完成的。首先,模型对医师输入的自然语言进行预处理,包括医疗文本分词、实体识别(如疾病、药物、检查项目)和意图分类(问诊、用药咨询、报告解读)等,以更准确地理解查询意图。随后,DeepSeek(R1)模型理解和生成自然语言,结合上下文优化答案相关性。此外,在推理与决策阶段,系统后续将集成医学影像和病理分析模型,与文本描述联合推理,以提供最合适的答案或建议。
1.1.4 应用层 应用层旨在提供便捷的交互界面,并将其嵌入医疗工作流程。该层基于B/S架构,支持Web端与移动端。通过Gradio快速搭建页面布局和基础系统功能,集成语音输入和富文本展示。应用层主要由用户界面和结果展示两部分组成:用户界面提供流畅的交互体验,并通过嵌入EMR系统辅助医师生成诊断报告;应用层可为患者提供智能导诊、用药咨询和检查结果解读等服务。结果展示部分则将系统获取的信息格式化处理后,以结构化文本或图表的形式呈现。
基于DeepSeek(R1)模型的智慧问答服务系统的问答流程设计如图2所示。在该系统中,医师或护士输入问题后,系统首先对自然语言进行预处理,随后通过问题分类模块判断是否需要调用外部知识库。如果问题仅依赖患者病历数据(如查询当前化疗方案),则直接关联EMR系统,调用DeepSeek(R1)模型生成答案。若问题涉及复杂的医学知识或需结合文献等外部信息,则通过LangChain构建问题链,从知识库检索相关数据,补充上下文后再输入模型进行推理。在需要外部知识的情况下,系统将检索到的多模态数据与患者信息进行融合。
图2 DeepSeek(R1)模型驱动的肿瘤智能问答系统流程设计
在答案生成后,系统对相关内容进行处理与优化,包括清理冗余信息(如删除低置信度建议),按“结论-依据-风险”的层级结构进行展示,并对依赖外部知识的内容标注来源。同时,医师可通过交互界面标记答案的准确性,触发人工审核并推动模型的迭代。高频修正问题会优先加入训练集,知识库也将同步更新权威指南。系统通过Redis缓存高频数据(如化疗剂量表)确保响应速度,并基于联邦学习框架保障数据隐私,最终实现高效、合规的临床辅助决策闭环。
DeepSeek(R1)模型在本地部署过程中,充分结合医院现有的基础设施完成适配与优化[12]。在算力适配方面,首先对模型参数进行结构化剪枝与量化压缩(如INT8),降低对GPU资源的需求,有效提升在中端服务器上的运行效率。此外,模型将推理任务划分为高频指令与文献补全两类路径。前者由院内服务器完成快速响应,后者则通过局部知识检索模块(RAG链路)完成语义扩展,从而在性能和推理深度之间取得平衡。知识库内容通过LangChain实现动态加载,结合医院内部HIS系统及本地EMR结构化字段进行语义对齐,并通过FHIR协议完成标准化数据接口设计。
在网络通信层,系统优先采用轻量化通信协议以降低带宽占用,并结合AES-256加密机制保障数据传输安全性。当前部署框架已完成与医院EMR、LIS与PACS系统的数据对接测试,在测试环境下模型对30例真实患者病历的调用与处理过程中,平均处理时延控制在1.2 s以内,支持动态知识图谱的构建与更新,基本满足肿瘤科一线使用场景的响应要求。
本系统基于岁荣肿瘤专病数据库与医院EMR历史病例构建RAG知识库,覆盖美国国立综合癌症网络、中国临床肿瘤学会等多部指南文本、PubMed高质量文献、专家共识及药品说明书等内容。通过规则引擎进行结构标准化与冗余剔除,文本经分句与摘要化处理后生成向量索引。知识库动态更新,模型可调用疾病诊断标准、化疗方案适应证、不良反应处理路径等核心字段,为问答和决策提供多层次信息支撑。
为提升DeepSeek(R1)模型在肿瘤专科场景下的决策支持能力,本文基于新疆军区总医院452份脱敏病历,围绕诊断、治疗方案及不良反应监测等多任务构建训练样本,采用监督微调策略对原始模型进行定向优化。模型训练采用AdamW优化器,初始学习率设定为2e-5,批量大小为16,训练轮次为4轮,并引入Early Stopping与梯度裁剪(clip=1.0)以控制过拟合风险。评估阶段以10%数据作为验证集,评估模型在不同任务模块的性能。结果显示,模型在关键信息抽取任务中的F1-score为0.92,治疗路径匹配任务Top-1准确率为87.8%,治疗推荐多选任务受试者操作特征曲线的曲线下面积约为0.94。微调后的模型已集成至本地部署系统,在与EMR系统联动调用中可实现数据字段自动识别与纠错提示,现阶段可稳定支持病历摘要和个体化方案推荐等应用,具备进一步扩展价值。
为验证模型在肿瘤专科中的真实应用能力,本文基于新疆军区总医院30例胃癌患者数据,对其在治疗决策、临床试验匹配及质量控制等关键环节中的综合表现进行系统评估。
模型利用RAG机制将患者个体特征与指南知识库动态匹配,实现路径个体化生成。结果显示,DeepSeek(R1)通过多模态数据融合为2例心功能不全患者自动生成降阶方案,规避了全量化疗风险。
DeepSeek(R1)利用语义检索及嵌入式伦理校对模块,将EMR转化为标准向量,与试验的纳入及排除标准进行动态匹配。系统可自动生成风险-效益概要并提取知情同意书中的关键条款,智能问答系统支持多层次解释(类比、图示、文献链接),增强患者的理解与依从性。
系统可自动抽取病历中关键字段(如TNM分期、分子分型、PD-L1表达水平),并识别典型逻辑矛盾(如病理报告“腺癌” vs.诊断“鳞癌”冲突、TNM分期与影像结果不符等),并根据指南推荐自动判断处方超适应证,触发药事流程复核。
尽管DeepSeek(R1)模型的本地化架构为肿瘤专科提供技术支持,但在实施过程中仍面临诸多挑战。
医院内部EMR、LIS、PACS系统采用私有数据接口与非结构化存储,导致跨系统数据融合效率低下。建立统一的数据平台可将各系统数据实时转换为FHIR R4标准格式,统一临床数据模型。
DeepSeek(R1)70B参数模型在常规医疗服务器部署时面临显存占用过高及推理延迟问题,难以满足临床实时响应需求。为解决该瓶颈,采用以下技术策略:首先,通过结构剪枝和量化压缩显著降低模型的运行负载,保障在中型GPU环境下的可部署性;其次,依托LangChain框架,采用模块化RAG机制,将大模型与脱敏后的专病数据库和多源信息系统(如EMR、LIS、PACS)解耦整合,减少重复推理计算,提高响应速度与资源利用率。
肿瘤诊疗指南的频繁更新导致静态知识库决策滞后。为实现知识库与临床实践同步,建立以下迭代机制:系统通过LangChain框架接入医院肿瘤专病数据库,并将美国国立综合癌症网络、中国临床肿瘤学会等权威指南以结构化方式纳入独立模块,实现与决策引擎的实时联动。在部署架构上,知识库更新与模型推理解耦,通过本地服务器定期维护指南内容并支持热更新,确保临床调用时始终基于最新标准执行推理任务。
DeepSeek(R1)模型可能会生成看似合理但实际上错误或不准确的信息,这种现象被称为“幻觉”[13]。本文在部署DeepSeek(R1)模型时引入RAG强约束框架,限定所有输出内容必须来自可检索的权威片段,并对生成内容溯源至具体的知识库出处。同时设定置信度阈值,生成内容置信度低于90%时自动触发人工审核流程,并在应用界面以红色标注提示用户注意。
尽管DeepSeek(R1)支持离线部署,解决部分数据隐私问题,但当前相关法规尚不完善,这使得许多医院在引入人工智能系统时持谨慎态度[14]。为推动模型在临床实践中的合规落地,应加快建立完善的隐私保护机制和法律框架,明确人工智能技术作为辅助工具的定位,确保其合法合规地运行。
《医疗机构部署DeepSeek专家共识》[15]指出,模型部署不应仅限于远程调用的“算法即服务”形式,而应构建以医师主导、数据驱动、流程闭环为核心的智能协同工作流。本研究通过DeepSeek(R1)的本地化架构实践,为智慧医院建设提供可复用的技术路径。随着模型性能的不断优化,DeepSeek(R1)有望在肿瘤诊疗实践中发挥更大作用。一方面,模型将进一步整合患者的基因组学、影像、病理及实时监测数据,构建多源信息融合的特征描述框架,有助于识别罕见突变、解析耐药机制,并辅助制订个体化治疗策略。另一方面,依托其开放可扩展的架构,可将关键功能模块进行轻量化配置,适配于基层医院与社区诊所,在辅助肿瘤早筛、早治方面提供支持。同时,模型还可接入区域公共卫生平台,辅助构建高危人群筛查预警机制。未来,模型在多病种、多学科诊疗、多模态任务和多层级医疗体系中的应用潜力,仍需临床、技术与政策层面的持续协同与机制保障。
利益冲突声明:本文所有作者均声明不存在利益冲突。
[1]TEMSAH M H,JAMAL A,ALHASAN K,et al.OpenAI o1-preview vs.ChatGPT in Healthcare:a new frontier in medical AI reasoning[J].Cureus,2024,16:e70640.
[2]MONDILLO G,COLOSIMO S,PERROTTA A,et al.Comparative evaluation of advanced AI reasoning models in pediatric clinical decision support:ChatGPT O1 vs DeepSeek-R1 [J].medRxiv,2025,10:25321169.
[3]WU Y,XIA C,CHEN W,et al.Comparative analysis of cancer statistics in China and the United States in 2024[J].Chin Med J(Engl),2024,137(24):3093-3100.
[4]健康中国研究中心癌症防治专家委员会,马飞.以患者为中心的肿瘤创新诊疗模式中国专家共识[J].肿瘤综合治疗电子杂志,2024,10(4):27-42.
[5]LU Z,YANG Z,SHEN L,et al.The landscape of cancer research and cancer care in China [J].Nat Med,2023,29(12):3022-3032.
[6]ZHANG S,METAXAS D.On the challenges and perspectives of foundation models for medical image analysis [J].Med Image Anal,2024,91:102996.
[7]LIANG W,CHEN P,ZOU X,et al.DeepSeek:the “Watson” to doctors-from assistance to collaboration[J].J Thorac Dis,2025,17(2):1103-1105.
[8]SINGHAL K,AZIZI S,TU T,et al.Large language models encode clinical knowledge [J].Nature,2023,620(7972):172-180.
[9]COLLINS K M,SUCHOLUTSKY I,BHATT U,et al.Building machines that learn and think with people [J].Nat Hum Behav,2024,8(10):1851-1863.
[10]NORMILE D.Chinese firm’s large language model makes a splash[J].Science,2025,387(6731):238.
[11]GALLIFANT J,BITTERMN D S,CELI L A,et al.Ethical debates amidst flawed healthcare artificial intelligence metrics[J].NPJ Digit Med,2024,7(1):243.
[12]戴国华,武晓鸽,詹文浩.DeepSeek在终端本地部署的解决方案与发展研究[J].移动通信,2025,49(3):100-106.
[13]TEMSAH A,ALHASSAN K,ALTAMIMI I,et al.DeepSeek in healthcare:revealing opportunities and steering challenges of a new open-source artificial intelligence frontier [J].Cureus,2025,17(2):e79221.
[14]ARORA A,ALDERMAN J E,PALMER J,et al.The value of standards for health datasets in artificial intelligence-based applications[J].Nat Med,2023,29(11):2929-2938.
[15]曹艳林,王婧,李昱熙,等.医疗机构部署DeepSeek专家共识[J].中国医学伦理学,2025,38(5):674-678.
Research on localized implementation and clinical application of DeepSeek(R1) model in oncology specialties
X