作者:郭芳琪、赵佳琦、陈蕊、刘晟
作者单位:医院超声诊疗科、普外三科
====================================
[摘要] 目的 应用.0版人工智能(AI)自动检测系统AI-SONICTMThyroid对甲状腺结节进行术前超声评估,并与不同年资超声医师应用常规超声检查主观诊断结论进行比较,探讨.0版AI自动检测系统在甲状腺结节良恶性鉴别诊断中的应用价值。方法 选择年8月至00年1月于我院普通外科接受手术治疗甲状腺结节患者47例的35枚甲状腺结节。所有患者术前均由1名有13年从事甲状腺超声诊断工作经验的高级职称医师和1名有4年工作经验的初级职称医师分别进行常规超声检查,同时由另1名有0年工作经验的超声医师在不知前名医判读结果的条件下利用.0版AI自动检测系统进行超声检查。采用Kappa检验评价不同年资医师常规超声检查及.0版AI自动检测系统的诊断结果与术后病理结果的一致性。结果 术后病理确诊恶性结节9枚,良性结节96枚。低年资医师应用常规超声检查诊断甲状腺结节良恶性的灵敏度、特异度、准确度分别为85.15%(/9)、66.67%(64/96)、79.69%(59/35),高年资超声医师诊断甲状腺结节良恶性的灵敏度、特异度、准确度分别为93.45%(14/9)、79.17%(76/96)、89.3%(90/35),.0版AI自动检测系统诊断甲状腺结节良恶性的灵敏度、特异度、准确度分别为9.58%(1/9)、71.88%(69/96)、86.46%(81/35)。Kappa一致性检验结果显示,高年资医师常规超声检查、.0版AI自动检测系统与病理诊断结果一致性均较高(Kappa值=0.78、0.74,P均<0.05),低年资医师常规超声检查与病理诊断结果一致性一般(Kappa值=0.55,P<0.05)。结论 .0版AI自动检测系统AI-SONICTMThyroid诊断甲状腺结节良恶性的灵敏度、准确度、特异度与高年资医师的常规超声检查结果相近,有望作为术前评估甲状腺结节良恶性的可靠辅助手段。[关键词] 人工智能;自动检测;高频超声;甲状腺结节;甲状腺影像报告和数据系统甲状腺癌发病率与日俱增,我国甲状腺癌以每年0%的速度持续增长,年全国甲状腺癌发病患者约有14.39万位[1]。准确鉴别甲状腺结节的良恶性对于甲状腺癌的早诊断、早治疗十分必要。高频超声因无创、便捷、准确等优势被广泛用于甲状腺结节检查,但是由于良恶性甲状腺结节的部分特征存在重叠,图像特征判读也易受医师主观经验的影响[],这均可能导致误诊甚至过度诊断,造成不可逆损伤[3]。年5月美国放射协会(AmericanCollegeofRadiology,ACR)发布了甲状腺影像报告和数据系统(thyroidimaging-reportinganddatasystem,TI-RADS)分类诊断标准指南[4],着重评估甲状腺结节的内部结构、回声、纵横比、边界、强回声点5类特征,并采用积分法进行风险分级[5],但仍然因医学成像设备成像条件、医师经验等而造成误诊或漏诊。前期研究表明,人工智能(ArtificialIntelligence)自动检测系统AI-SONICTMThroid(DEMETICS?超声诊断机器人)对甲状腺结节良恶性诊断的灵敏度、准确度稍逊于经验丰富的超声医师,但较相近,可作为术前评估甲状腺结节良恶性的有效补充,但由于该研究样本量偏小,特异度仅为68.9%[6]。.0版AI自动检测系统DEMETICS?超声诊断机器人通过扩大样本量进行深度学习,除继续对甲状腺结节的声学细节特征进行自动识别、精细分析外,也对微小结节、不典型增生结节及细胞生长活跃结节等的良恶性风险诊断概率值划分进行了优化调整,其灵敏度、特异度、准确度较初始版AI自动检测系统AI-SONICTMThroid显著提高。本研究回顾了47例手术患者共35个甲状腺结节的超声影像学资料,以术后病理诊断为金标准,比较.0版AI自动检测系统与不同年资超声医师常规检查诊断良恶性甲状腺结节的差异,探讨升级后AI自动检测系统术前评估甲状腺结节良恶性的价值。
1 资料和方法1.1 研究资料选择年8月至00年1月于我院普通外科接受手术治疗甲状腺结节患者47例的35枚甲状腺结节。纳入标准:(1)术前在我院接受高年资医师(具有13年工作经验的高级职称医师)低年资医师(具有4年工作经验的初级职称医师)常规超声检查和.0版AI自动检测系统检查;()观察结节经过手术病理证实;(3)观察结节有完整的横、纵标准切面图;(4)观察结节的超声图像均无测量线或点的标注。排除标准:(1)观察结节体积偏大,超出切面的观察范围;()超声检查横、纵标准切面显示不清晰;(3)曾诊断偏良性结节仅进行超声随访者;(4)曾诊断偏恶性结节仅进行细胞学穿刺者。本研究通过我院伦理委员会审批,受检者检查前均签署了知情同意书。
1. 仪器与方法1..1 常规超声检查 采用日本日立公司HitachiPreirus超声诊断仪进行甲状腺常规超声检查,探头型号L74M,频率为5~13MHz。系统参数恒定:增益为30dB,时间增益补偿为中间位(零补偿),图像聚焦区深度为.0~3.75cm,组织热指数<0.4,机械指数为1.。由名多年从事甲状腺超声诊断工作经验的超声医师(具有13年工作经验的高级职称医师1名,具有4年工作经验的初级职称医师1名),在检查前未获知患者信息及临床资料的情况下,按照上海市超声质量控制要求[7]和《超声医学》第6版[8]甲状腺超声操作要点及诊断标准,对术前患者的甲状腺组织(两侧叶、峡部)进行全面细致检查。检查过程中若发现结节,则需反复重点扫查,并按照ACR发布的TI-RADS分类标准[9]对检出甲状腺结节进行声学特征评估,以实性、低回声或极低回声、边界不规则或边缘小分叶、纵横比>1、微钙化这5项特征作为偏恶性的判断条件,确立TI-RADS3类(无恶性超声表现)、4a类(1个恶性超声表现)、4b类(个恶性超声表现)、4c类(3个或4个恶性超声表现)和5类(5个恶性超声表现)。将TI-RADS4~5类归为偏恶性,TI-RADS3类归为偏良性[10-11]。
1...0版AI自动检测系统检查 采用.0版AI-SONICTMThyroid甲状腺结节人工智能辅助诊断系统(DEMETICS?超声诊断机器人,浙江德尚韵兴医疗科技有限公司)进行检查。该系统经过6万余例甲状腺结节穿刺及病理结果对照的深度学习,创新性地引入旋转不变网络层、Splitdropout等新概念[1],持续优化深度学习理论和变分能量泛函结合的图像处理与分析方法(图1)。图1基于预训练卷积神经网络的.0版AI自动检测系统诊断甲状腺结节良恶性的模式图
检查操作步骤同常规超声检查,由1名从事甲状腺超声诊断工作0年的超声医师在不知患者任何临床信息和前名医师判读结果的条件下进行操作,并由1名AI自动检测系统公司的应用工程师对该操作医师进行全程规范的监督与指导,便于获取最佳的标准化超声切面图像。医师将扫查的图像通过采集卡或DICOM方式传输至服务器,算法自动探测病灶位置,并进行自动标记、处理、分析。通过AI算法自动定量甲状腺结节的大小、边界、形态、内部回声、钙化灶5类特征,每个结节分别经过4次纵、横切面显示,实时冻结存储传输至自动判读系统,直至TI-RADS分类及良恶性概率值趋于稳定时,记录系统自动判读结节的最高1次TI-RADS分类及风险概率值[6]。风险概率值介于0~1,其中0~0.40为偏良性(无恶性特征),建议随访;0.41~0.60为可疑恶性(存在恶性特征倾向),建议进一步检查;0.61~1.0为偏恶性(存在恶性特征),建议进行病理检查。因为当结节风险概率值为0.41时说明该结节具有一定的恶性特征倾向,存在一定的恶性风险,因此将风险概率值0.41归为诊断恶性临界值,由安装在客户端软件的超声工作站自动呈现出良恶性超声诊断结论及处理建议。
图图A~I.0版AI自动检测系统工作界面
针对病灶出具的数据评分及影像报告为0.51(纵)、0.48(横),提示可疑,建议进一步检测,病理结果显示甲状腺滤泡性肿瘤。图A为安装客户端软件的超声工作站图;图B为自动呈现出超声诊断建议及评分概率值;图C~D为左侧甲状腺结节长轴与短轴标准切面扫查图,AI-SONICTMThroid系统通过图像分析该病灶可疑恶性程度为0.51(纵)、0.48(横);图E为边缘特征分析,颜色由蓝、绿、*、红依次显示由清晰转向模糊,AI-SONICTMThroid系统检测该病灶边缘尚清晰;图F自动识别病灶边缘并完整包裹,分析边界线内部有少许高回声,红色点代表高回声;图GAI-SONICTMThroid系统显示病灶内部成分为以实性为主;图H检测病灶内部回声均匀与否,颜色由蓝、绿、*、红依次显示由均匀转向不均匀,AI-SONICTMThroid系统检测该病灶内部回声不均匀;图I检测该结节内部回声,红、绿、蓝、深蓝、紫分别代表高回声、中等回声、低回声、极低回声、无回声,AI-SONICTMThroid系统检测该病灶为中等回声。1.3 统计学处理
应用SPSS1.0软件进行统计学分析。计量资料以`x±s表示,计数资料以例(枚)数和百分数表示。以术后病理结果为金标准,采用基于Kappa系数的一致性检验[13]评价名不同年资医师常规超声检查及.0版AI自动检测系统诊断结果与术后病理结果的一致性,计算Kappa系数、灵敏度、特异度、准确度。Kappa系数越大说明一致性越高,Kappa值≥0.75说明结果一致性好,0.4≤Kappa值<0.75说明结果一致性一般,Kappa值<0.4说明一致性差。检验水准(α)为0.05。 结 果.1 甲状腺结节特征
共纳入47例接受手术治疗甲状腺结节患者的35枚甲状腺结节,其中男40例(69枚甲状腺结节),女07例(56枚甲状腺结节),年龄为13~84岁,平均年龄为(49.1±10.8)岁。术后病理确诊恶性结节9枚,平均最大径为(11.40±6.17)mm,其中乳头状癌0枚,滤泡上皮肿瘤6枚,滤泡上皮不典型增生17枚,髓样癌1枚,恶性肿瘤3枚;良性结节96枚,平均最大径为(19.45±9.16)mm,其中腺瘤5枚,结节性甲状腺肿6枚,滤泡结节增生枚,胶质潴留1枚,甲状腺旁腺增生枚,良性结节1枚,纤维性钙化3枚。. 不同年资超声医师与.0版AI自动检测系统对甲状腺结节良恶性的诊断效能
名不同年资的超声医师分别对每枚甲状腺结节进行TI-RADS评分,将其分为TI-RADS1~TI-RADS5类[14],然后按步骤进行.0版AI自动检测,并以手术病理结果作为对照,以风险概率值0.41(TI-RADS4a)为恶性诊断界值,计算3种检查方法的诊断效能。35枚结节中,低年资超声医师检出98枚结节偏良性,7枚偏恶性;高年资超声医师检出91枚偏良性,34枚偏恶性;AI自动检测系统检出86枚偏良性(建议随访),31枚可疑恶性(建议随访),08枚偏恶性(建议手术)。AI自动检测系统与术后病理结果一致的结节81枚,其中69枚偏良性,1枚偏恶性(其中可疑恶性1例,偏恶性例);AI自动检测系统误诊44枚结节,其中7枚良性结节中误诊为可疑恶性10例、偏恶性17例,17枚恶性结节误诊为偏良性。在AI自动检测系统误诊的44枚结节中,31枚结节高年资超声医师也同时误诊,其中19枚良性结节误诊为偏恶性,1枚恶性结节误诊为偏良性,包括9枚不典型增生、枚乳头状癌、1枚髓样癌、5枚滤泡腺瘤、1枚嗜酸性腺瘤、11枚结节性甲状腺肿、1枚局灶纤维结节伴钙化、1枚囊肿吸收后改变;其余13枚结节为.0版AI自动检测系统单独误诊,其中9枚良性结节误诊为偏恶性,4枚恶性结节误诊为偏良性,包括3枚乳头状癌、1枚不典型增生、6枚结节性甲状腺、1枚肉芽肿性甲状腺炎、1枚钙化灶、1枚甲状腺旁腺增生。.0版AI自动检测系统诊断甲状腺结节良恶性的灵敏度低于高年资医师(9.58%1/9vs93.45%14/9),但高于低年资医师(9.58%1/9vs85.15%/9),差异均有统计学意义。.0版AI自动检测系统诊断甲状腺结节良恶性的特异度低于高年资医师(71.88%69/96vs79.17%76/96),但高于低年资医师(71.88%69/96vs66.67%64/96),差异均有统计学意义。.0版AI自动检测系统、低年资医师、高年资医师诊断甲状腺结节良恶性的阳性预测值和阴性预测值分别为88.70%、85.90%、91.45%和71.88%、65.31%、83.50%。与术后病理诊断结果进行一致性检验,结果显示,低年资医师应用常规超声诊断甲状腺结节良恶性的结果与术后病理诊断一致性一般(Kappa值=0.55,P<0.),高年资医师应用常规超声诊断甲状腺结节良恶性的结果与术后病理诊断一致性较高(Kappa值=0.78,P<0.),.0版AI自动检测系统诊断甲状腺结节良恶性的结果与术后病理诊断一致性也较高(Kappa值=0.74,P<0.)。见表1。表1 术前不同年资医师常规超声检查与.0版AI自动检测系统对甲状腺结节良恶性的诊断效能比较Tab1Comparisonofpreoperativediagnosiseffectsofthyroidnodulesonbenignandmalignantbysonographerswithdifferentseniorityand.0versionofAIautomaticdetectionsystem.3.0版AI自动检测系统对可疑恶性甲状腺结节的诊断结果
对AI自动检测系统诊断的31枚可疑恶性结节与术后病理结果进行对比发现,1枚为恶性,10枚为良性。10枚良性结节中7枚为结节性甲状腺肿,1枚为肉芽肿性甲状腺炎,1枚为滤泡性腺瘤,1枚为滤泡性腺瘤囊性变(图3)。图3.0版AI自动检测系统误诊为可疑恶性的良性甲状腺结节
3 讨 论随着人工智能辅助诊断技术的不断更新与改进,运用人工智能辅助诊断技术可对组织内异常区域进行自动分割、快速分析,定量病灶的影像学特征,并对检测区域进行精准评估,降低人为因素所致的医疗失误[15-16]。近年来,人工智能驱动的超声技术也越来越成熟,诊断结果越来越贴近于病理学诊断,特别是超声人工智能诊断工具的出现,为甲状腺结节、乳腺结节等高发疾病的早期筛查和良恶性评估提供了有益补充[17]。
AI-SONICTMThroid系统.0版经过后期不断输入病例数据进行特征学习、病灶分割、多层次特征提取,较1.0版不仅在甲状腺结节超声灰阶像提供了客观一致的视觉影像,对系统分析、界面显示、诊断结果划分进行了改善,降低了不同超声医师检查的差异及同一超声医师多次判读的差异,还能提供可修正的诊断结果,快速生成数字化报告供医师参考。本研究纳入47例患者共35枚甲状腺结节作为研究对象,比较了.0版AI自动检测系统与不同年资医师常规超声检查对甲状腺结节良恶性的诊断效能,结果显示.0版AI自动检测系统的灵敏度、特异度、准确度均低于高年资医师,但高于低年资医师。分析原因可能是低年资医师临床经验相对不足,对结节的认知、观察及专注能力等均不及高年资医师,在短时间内做出诊断不可避免会存在漏诊和误诊。
此外,.0版AI自动检测系统较1.0版在用户管理方面优化了预览界面,新增了良恶性诊断详情,并且对需进一步跟踪随访的病例增加了收藏或标注设置,在人工智能分析算法方面也对目标区域进行了降噪、增强、细化图像特征等预处理,提升了AI诊断的稳定性,灵敏度、特异度、准确度也有所提升。通过高效智能整合,.0版AI自动检测系统对甲状腺结节的风险概率值划分更精细化,尤其针对一些无法用语言描述,甚至精细结构肉眼较难观察的病变,如微小结节、木乃伊结节,以及超声特征不明显的恶性结节,系统界面做出了0.41~0.60可疑区域风险概率值的*色框优化提示,为超声医师做出最终诊断时提供了重要参考。本研究中,.0版AI自动检测系统诊断甲状腺结节良恶性的灵敏度、特异度与准确度与1.0版AI自动检测系统[6]相比均更高[分别为9.58%(1/9)vs89.58%(86/96)、71.88%(69/96)vs68.9%(8/41)、86.46%(81/35)vs83.1%(/)],与病理诊断结果一致性也较高(Kappa值=0.74,P<0.05),1.0版AI自动检测系统与病理诊断结果一致性一般(Kappa值=0.59,P<0.05)[6]。
本研究中,.0版AI自动检测系统共误诊44枚甲状腺结节,其中31枚结节在高年资医师利用常规超声检查时同样误诊。其原因可能是多数良性结节一般与腺体增生或炎症形成有关,组织质地较软,而恶性结节多数由细胞异常增殖和分化,组织质地较硬,经验丰富的超声医师可通过借助弹性成像分析结节组织的软硬程度或硬度属性对结节的良恶性进行评估,硬度越大甲状腺结节恶性程度越高[18]。对于良恶性超声特征存在重叠的结节,如胶质潴留干涸后局部晶体析出形成类似钙化成分、炎性细胞分布不规则的肉芽肿性甲状腺炎等,高年资超声医师可借助常规超声实时、动态、可回放等优势,反复多切面观察结节的物理结构及彩色血流分布特征,并结合患者甲状腺功能及相关抗体的实验室检查结果进行针对性综合判断分析,从而确保高年资超声医师降低误诊率。
研究发现,甲状腺癌多以乳头状癌多见,髓样癌的发病率仅占%,约70%的甲状腺髓样癌患者在触诊甲状腺结节时就已经发生淋巴结转移[19],但在超声图像上缺乏特异性。本研究中,.0版AI自动检测系统与常规超声检查同时误诊的1枚甲状腺髓样癌的结节,高、低年资超声医师均诊断为TI3类,考虑腺瘤囊性变可能,AI自动检测系统评分为0.4(纵)、0.3(横),诊断亦为偏良性、建议随访。由于该结节体积较大,患者接受手术切除治疗,术后病理提示甲状腺髓样癌。分析该例患者误诊原因,甲状腺髓样癌较乳头状癌少见,在癌前病变及早期癌中,尽管在前期工作中不断完善加载AI自动检测系统病例数据的学习,但还是相对缺乏该类少见病理类型甲状腺结节的大数据输入,大数据样本的准确度、可靠度仍需要一定的时间进行搜集和积累,同时超声图像上甲状腺实质可显示质地纹理不均一,与周围结节分界不明显,使精准全自动分割甲状腺结节具有挑战。
AI自动检测系统基于甲状腺结节超声图像特征,在前期已加载大量数据进行了较深入的研究,能够辅助术前甲状腺结节良恶性评估,但目前的版本都只针对静态灰阶超声图像进行处理和分析,尚不能对甲状腺结节弹性成像、多普勒彩色血流显像等多模态进行智能诊断。今后可以研发有效分析动态视频、彩色多普勒图像及弹性图像的多模态超声人工智能诊断工具,运用数字图像处理技术对超声医学图像进行相应的标注,以期为临床提供更全面、更直观、更快速的帮助信息,提高诊断准确性。
[参考文献][1]SiposJA.Advancesinultrasoundforthediagnosisandmanagementofthyroidcancer[J].Thyroid,,19:-.doi:10./thy..
[]ChoiSH,KimEK,KwakJY,KimMJ,sonEJ.Interobserverandintraobservervariationsinultrasoundassessmentofthyroidnodules[J].Thyroid,,0:-17.doi:10./thy..
[3]LaVecchiaC,MalvezziM,BosettiC,GaravelloW,BertuccioP,LeviF,NegriE.Thyroidcancermortalityandincidence:aglobaloverview[J].IntJCancer,,:-.doi:10./ijc.
[4]TesslerFN,MiddletonWD,GrantEG,HoangJK,BerlandLL,TeefeySA,etal.ACRThyroidImaging,ReportingandDataSystem(TI-RADS):WhitePaperoftheACRTIRADSCommittee[J].JAmCollRadiol,,14:-.doi:10./j.jacr..01.
[5]WangY,LeiKR,HeYP,LiXL,RenWW,ZhaoCK,etal.Malignancyriskstratificationofthyroidnodules: