DOI:10.20047/j.issn1673-7210.2025.32.04
中图分类号:R780.1
吴丽琴, 许晓锋, 许志强, 郑德春
| 【作者机构】 | 莆田学院附属医院口腔医学中心 |
| 【分 类 号】 | R780.1 |
| 【基 金】 | 福建省自然科学基金资助项目(2024J011465) 莆田学院校院医学科研联合基金项目(2024127)。 |
种植牙技术作为目前修复牙列缺损、恢复咀嚼功能及面部美观的关键手段,临床应用日益广泛[1-3]。然而,在临床实践中,患者常因既往种植治疗的详细信息(如品牌、型号、尺寸)记录缺失或分散难以获取,导致口腔医师在维护或修复时,难以准确选择和匹配基台、牙冠等部件,直接影响后续治疗的效率、成本及成功率[4]。
口腔X线片是获取颌骨内种植体现状(形态、尺寸、连接方式等)的主要依据[4]。但面对市场上种类繁多的种植体系统,仅凭肉眼和经验进行人工识别与匹配既耗时又易出错,存在显著局限性[5]。近年来,深度学习技术在医学影像分析领域展现出强大的特征提取与模式识别能力,在放射学、病理学等方向取得了显著成效,为医学诊断提供了智能化解决方案[6-10]。因此,本研究聚焦于口腔医学领域,旨在探索和开发基于深度学习的口腔X线影像种植体自动识别技术,有望突破人工识别的瓶颈,实现种植体品牌、型号等关键信息的快速、精准判读,提升临床诊断效率,优化修复方案制订,为患者提供更精准高效的诊疗服务。
本研究主要针对常用的6种种植体品牌进行研究,包括瑞士士卓曼种植体(以下简称“ITI”)、瑞典诺贝尔种植体(以下简称“Nobel”)、以色列Mis种植体(以下简称“Mis”)、瑞典Astra Tech微细螺纹种植体(以下简称“Astra”)、德国Bego种植体(以下简称“Bego”)、美国Bicon种植体(以下简称“Bicon”),详细信息见表1。
表1 6种种植体的详细信息
由于个体差异,每例患者种植牙齿的数量不一致;因牙槽骨及周围组织影响,用到的种植牙品牌的长度与直径也不相同。因此,在一张图片中可能会出现1个或多个种植体,并且一般情况下,同一例患者种植的是同一品牌的种植体。从图1可以看出,不同品牌的种植体在形态结构、螺纹结构、表面粗糙程度等方面差异明显。螺纹的深浅、角度及其分布方式会影响到种植体与骨的接触面积,会影响初期稳定性;同时,表面粗糙度较大的种植体能够增加与骨组织的接触面积,可以促进骨整合[11]。6种种植体在口腔中的X线影像见图1。
图1 6种品牌种植体影像
选择2024年4月至12月莆田学院附属医院口腔医学中心及北京大学口腔医院的口腔根尖X线片,在专业医师的指导下对影像中种植体的类别和位置信息进行标注,同时获取影像数据,建立种植体品牌数据集。本研究中所使用的口腔根尖X线片均不涉及患者姓名、年龄等个人信息。本研究共挑选了300张口腔根尖X线片作为数据集样本,其中90%的样本被用作训练集和验证集,其余10%用作测试集,具体见表2。
表2 样本划分情况(个)
1.3.1 Faster RCNN基于TensorFlow框架构建Faster RCNN模型,通过结合两阶段网络与区域提议网络(region proposal network,RPN),物体检测的精度更高。Faster RCNN整体的网络结构由卷积层、RPN、特征金字塔网络(feature pyramid network,FPN)及区域分类网络等组成,见图2。输入图像经过Resize统一调整为固定尺寸后,采用ResNet50作为特征提取的主干网络,生成特征图。RPN负责生成候选区域,RPN的输出是一组包含边界框坐标和置信度分数的候选区域。在RPN网络中,首先进行1次3×3卷积,接着分别进行1个9(9×1)通道的1×1卷积和1个36(9×4)通道的1×1卷积;其中,9×1通道的卷积用于预测每个网格点的先验框是否包含物体,而9×4通道的卷积用于调整先验框的边界框坐标。RPN的输出目前只是粗略筛选后的候选区域,即建议框。感兴趣区域池化层将RPN生成的候选区域映射到特征图上,提取固定大小的感兴趣区域特征,随后通过全连接层生成2个输出:①边界框回归预测用于调整候选区域的边界框;②分类预测用于确定候选区域的类别。分类预测通过Softmax函数进行归一化,得到每个类别的概率。最终输出的是经过边界框回归调整后的边界框及其对应的类别和位置信息。
图2 Faster RCNN结构
RPN:区域提议网络。
1.3.2 注意力机制优化 注意力机制的核心思想是通过赋予重要特征更高的权重,同时抑制无关信息,以优化特征表达。引入注意力机制,可以使网络能够更加关注关键区域。本研究在Faster RCNN网络的基础上,分别添加3种不同的注意力机制即SE、CBAM、ECA,通过增强模型对重要特征的提取能力,以此提升种植体品牌的识别精度[12-14]。SE通过动态调整通道权重,使网络能更好地捕捉全局信息,提高特征的区分度。其可以抑制与任务无关的特征通道,降低计算复杂度。相比于SE仅关注通道信息,CBAM进一步引入空间注意力,使模型能够同时关注“重要特征通道”和“关键区域”,从而提升特征表达能力,提高目标检测和分类任务的性能。ECA机制的核心思想是避免使用全连接层进行通道注意力计算,而采用一维卷积来捕捉局部跨通道交互,从而减少参数量并提高计算效率。
在ResNet50结构中,网络从浅层到深层逐步提取特征,越深层的特征具有更高级的语义信息。然而,由于特征通道的增多,信息可能变得冗余或对关键目标区域的关注度下降。因此,在第4个模块后引入注意力机制,可以有效增强重要特征的表达能力,提高模型的判别能力。由于ResNet50的第4个模块输出的通道数较多(1 024维),直接进入第5个模块可能会导致冗余信息过多,重要特征信息被稀释。添加注意力机制,可以增强有效信息的提取、减少冗余、提高分类和检测精度。引入注意力的ResNet50网络架构见图3。
图3 添加注意力的ResNet50网络架构
结果显示,平均检测精度(mean average precision,mAP)为90.3%、准确率为93.5%、召回率为96.3%、F1分数为94.9%。见表3。
表3 添加注意力机制前后的性能指标比较结果
注mAP:平均检测精度。
在口腔X线影像种植体识别研究中,模型能够精准识别不同品牌的种植体,且置信度≥0.87,识别稳定性和可靠性极高。检测框准确地覆盖了种植体区域,没有明显的误检或偏移,Faster RCNN能够精准匹配种植体的边界和形态。见图4。
图4 Faster RCNN检测结果
ITI置信度为0.99;Nobel置信度为0.99;Mis置信度为0.87;Astra置信度为0.93;Bego置信度为1.00;Bicon置信度为0.99。
加入SE后,模型的mAP提升至97.2%,准确率提升至97.6%,召回率提升至97.9%,F1分数提升至97.7%;添加CBAM后,mAP提升至93.9%,但是准确率和召回率均下降;添加ECA后,mAP升高,准确率降低3.3%,召回率提升至99.5%。见表3。
本研究结果显示,Faster RCNN检测的mAP为90.3%,而且其检测框在多个样本上的定位具体有准确性和稳定性,提示其在种植体识别任务中具备更高的整体检测精度,识别结果具有高度可信度。这得益于Faster RCNN采用两阶段检测结构,通过RPN生成高质量的候选区域,并在第二阶段精细分类与回归,有效提高了检测的准确性[15]。
准确率越高说明被误检和漏检情况越少,本研究结果显示,Faster RCNN检测的准确率为93.5%,提示几乎目标种植体都能被检测出来;另外,Faster RCNN检测的召回率为96.3%,提示其既能识别大部分目标,又有效减少错误检测[16]。
F1分数综合反映准确率与召回率的权衡,是衡量模型整体检测能力的重要指标。本研究结果显示,Faster RCNN检测的F1分数为94.9%,提示其在“检测全面性”与“检测准确性”之间取得了最优平衡,综合识别能力强。这一指标对于医学影像辅助诊断尤为重要[17]。
引入注意力机制后,模型性能普遍提升,本研究结果显示,加入SE后mAP提升至97.2%,准确率与召回率分别提升至97.6%和97.9%,F1分数提升至97.7%。SE通过自适应调整通道权重,使网络能够更好地关注有效特征,并忽略了不相关信息,从而增强了模型的识别能力;准确率和召回率均升高,说明相比不加注意力机制其误检和漏检均减少,提高了分类的可靠性。
本研究结果显示,加入CBAM后,虽然mAP略升至93.9%,但性能波动较大,误检和漏检更多,可能是由于CBAM结合了通道注意力和空间注意力,使得模型的参数更多,结构更复杂,导致过拟合或特征冗余,因此特征提取能力有所下降。加入ECA后召回率提升至99.5%,提示大部分的种植体都能被检测到,几乎无漏检;但准确率下降较多,提示其更偏向提高召回能力。
总体来看,SE注意力机制的效果最佳,在本研究场景下最为适用[18]。主要原因在于其独特的通道级特征重标定机制。SE通过全局平均池化提取通道信息,并利用全连接层学习通道间的权重分布,使模型能够自动调整不同通道的贡献度,从而增强重要特征,抑制无关特征。这种方式能够提升模型对目标特征的灵敏度,提高识别精度。CBAM和ECA虽然在不同程度上优化了性能,但效果不如SE显著。CBAM额外引入了空间注意力,但可能导致特征冗余,在本任务中并未提供显著优势;ECA通过1D卷积实现高效通道注意力,但缺少全局通道建模,导致精度提升有限。
尽管Faster RCNN在性能上表现优异,但其推理速度相对较慢,尤其在添加注意力机制之后,模型参数量和计算开销进一步上升。有研究发现,YOLOv7和SSD可能更适合实时检测场景[19-20]。今后在实际临床部署中,需要综合考虑精度与效率的权衡,通过模型结构轻量化设计或引入MobileNet等轻量主干网络,进一步优化性能。
本研究使用Faster RCNN对口腔根尖X线片中的种植体品牌进行识别分类,在主干网络ResNet50的基础上引入注意力机制。结果显示,Faster RCNN改进的ResNet50网络对种植体品牌识别分类具有较好的效果。本研究提出的方法也为其他类似种植体品牌的识别分类提供了参考,通过优化输入图像特征提取层和全连接层的参数,可以进一步提高网络对种植体品牌识别分类效果。今后还可以将改进后的模型应用到其他领域,如计算机视觉、医疗等,进一步提升模型的性能,为口腔医学领域提供帮助;同时应对种植体图像进行更精细的识别,希望能够识别出不同品牌、不同型号的种植体,可以快速帮助口腔医师获取更精准的信息,为患者制订个性化治疗方案,推动口腔医疗技术的发展。
利益冲突声明:本文所有作者均声明不存在利益冲突。
[1] 陈小冬,曲哲.数字化技术在全口固定式种植义齿修复中的应用[J].口腔医学研究,2023,39(8):663-670.
[2] 单小峰,蔡志刚.颌骨缺损血管化游离骨瓣重建后的种植修复治疗[J].华西口腔医学杂志,2023,41(2):123-128.
[3] 罗之琳,曹颖光.口腔种植机器人的精度及应用现状[J].口腔医学研究,2024,40(11):950-955.
[4] ZHAO Y,ZHU L,WANG W,et al.Progressive multi-task learning for fine-grained dental implant classification and segmentation in CBCT image [J].Comput Biol Med,2025,189:109896.
[5] CHAURASIA A,NAMACHIVAYAM A,KOCA-ÜNSAL R B,et al.Deep-learning performance in identifying and classifying dental implant systems from dental imaging:a systematic review and meta-analysis [J].J Periodontal Implant Sci,2024,54(1):3-12.
[6] ZHANG Z,SEJDIC' E.Radiological images and machine learning:Trends,perspectives,and prospects[J].Comput Biol Med,2019,108:354-370.
[7] KOHLAKALA A,COETZER J,BERTELS J,et al.Deep learning-based dental implant recognition using synthetic X-ray images[J].Med Biol Eng Comput,2022,60(10):2951-2968.
[8] LASSAU N,AMMARI S,CHOUZENOUX E,et al.Integrating deep learning CT-scan model,bio logical and clinical variables to predict severity of COVID-19 patients [J].Nat Commun,2021,12(1):634.
[9] AGGARWALR,SOUNDERAJAH V,MARTIN G,et al.Diagnostic accuracy of deep learning in medical imaging:a systematic review and meta-analysis[J].NPJ Digit Med,2021,4(1):65.
[10] LIU P,BAGI K.A tailored deep learning approach for early detection of oral cancer using a 19-layer CNN on clinical lip and tongue images[J].Sci Rep,2025,15(1):23851.
[11] XU Z,HUANG J,HE Y,et al.Fabrication of an ordered micro-/nanotextured titanium surface to improve osseointegration[J].Colloids Surf B Biointerfaces,2022,214:112446.
[12] HUJ,SHENL,SUNG.Squeeze-and-ExcitationNetworks[C]//proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,2018:7132-7141.
[13] WONGSUWAN J,TUBTAWEE T,NIRATTISAIKUL S,et al.Enhancing ultrasonographic detection of hepatocellular carcinoma with artificial intelligence:current applications,challenges and future directions [J].BMJ Open Gastroenterol,2025,12(1):1-11.
[14] WANG Q,WU B,ZHU P,et al.ECA-Net:Efficient Channel Attention for Deep Convolutional Neural Networks [C]//proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition,2020:11534-11552.
[15] SARı A H,SARı H,MAGAT G.Artificial intelligencebased detection of dens invaginatus in panoramic radiographs[J].BMC Oral Health,2025,25(1):917.
[16] MOUFTI M A,ABU TALIB M,AL MOKDAD S,et al.An Artificial Intelligence Solution for Automated Dental Inspection and Charting[J].Int Dent J,2025,75(4):100849.
[17] MUN S B,LIM H J,KIM Y J,et al.Deep learning-based prediction of possibility for immediate implant placement using panoramic radiography [J].Sci Rep,2025,15(1):5202.
[18]
Z
ELIK S T A,ÜZEN H,
ENGÜR A,et al.Enhanced Panoramic Radiograph-Based Tooth Segmentation and Identification Using an Attention Gate-Based Encoder-Decoder Network[J].Diagnostics(Basel),2024,14(23):2719.
[19] SAKAI K,MURAMATSU C,SEINO Y,et al.Detection and dual-label classification of tooth number and condition in dental panoramic radiographs including deciduous teeth[J].Radiol Phys Technol,2025,18(3):821-832.
[20] ROONGRUANGSILP P,NARKBUAKAEW W,KHONGKHUNTHIAN P.Performance of two different artificial intelligence models in dental implant planning among four different implant planning software:a comparative study [J].BMC Oral Health,2025,25(1):984.
Research on implant brands identification based on deep learning
X