机器学习(machine learning,ML)是人工智能的一个分支。ML为计算机算法提供自我学习优化能力而不局限于固定的规则,通过学习数据特征优化模型参数,并且能够采用优化后的参数对样本外的数据进行预测[1]。神经网络(neural network,NN),也被称为人工神经网络(artificial neural network,ANN),属于ML的一种。NN是一种使用多层计算来模仿人类大脑分析信息和得出结论的概念[2]。深度学习(deep learning,DL)是NN的一个分支,其特点是通过多个隐藏节点层,对数据特征进行多次抽象学习。DL增加了节点的层数,网络的总体规模更大,可以更准确地表示复杂的相互关系[3]。
常见的脊柱畸形包括青少年特发性脊柱侧凸(adolescent idiopathic scoliosis,AIS)、成人脊柱畸形(adult spine deformity,ASD)等。AIS是青少年最常见的脊柱疾病,全球患病率为0.5%~5.2%[4-6]。AIS是一种复杂的脊柱三维畸形,病因尚不明确,严重的AIS可以伴随心肺功能的异常,侧凸Cobb角>40°的患者需要矫形手术治疗。随着人口老龄化的发展,ASD的患病率正在逐渐上升,与AIS相比,ASD的病理生理改变更复杂,临床表现更多样化,治疗更困难[7]。自20世纪80年代以来,临床专家对脊柱畸形的理解取得了长足的进步,然而由于脊柱畸形临床表现的异质性和病因的复杂性,其诊治方面依然存在诸多挑战,为ML提供了一个良好的临床应用场景[8]。目前,ML已经越来越多地被应用于脊柱畸形诊治的各个方面,并展现出巨大的潜力[9]。
1脊柱畸形的测量
脊柱畸形患者的诊断、治疗和随访过程都需要对脊柱影像学参数进行测量,ML可以通过自动化测量的方式减轻医师的工作量,并且在处理高通量数据方面具有更加高效、准确的优势。Galbusera等[10]从493例脊柱疾病(包括AIS、ASD和脊柱退行性病变)患者的EOS系统脊柱三维重建图像中提取出78个脊柱标志,并开发了一个全卷积神经网络模型,以便从双平面脊柱X线片上识别这些标志的位置,从而计算脊柱影像参数(包括胸椎后凸角、腰椎前凸角、脊柱侧凸Cobb角、骨盆投射角、骶骨倾斜度、骨盆倾斜角等)。该模型极大提高了脊柱畸形患者脊柱参数的获取效率,测量所得到的参数与标准测量方法的结果高度一致。Cobb角的测量对脊柱侧凸的诊断和治疗决策具有重要意义。Zhang等[11]使用275张脊柱侧凸模型的正侧位X线片训练了一个深度神经网络系统,用于自动测量脊柱侧凸Cobb角,并在65例AIS患者的X线片和40张脊柱模型的X线片上进行测试,该系统自动测量的结果与人工测量结果高度一致。Horng等[12]开发了一个卷积神经网络(convolutional neural network,CNN)模型,实现自动化脊柱定位和椎体分割,能够在正位X线片上自动测量脊柱侧凸Cobb角,其结果与人工测量相比差异无统计学意义。
2脊柱畸形的筛查
筛查有利于脊柱畸形尤其是AIS的早发现、早诊断、早治疗。传统筛查方法主要依靠体格检查和辅助检查,阳性预测值低,常导致不必要的转诊和辐射[13]。在脊柱畸形筛查方面,ML具有效率高、准确度高、流程简化、成本低等优势。
Yang等[14]开发的DL算法可以根据站立位裸露背部的大体照片筛查AIS,纳入了3240例AIS患者作为训练集,结果显示识别侧凸Cobb角≥10°时受试者操作特征曲线的曲线下面积(area under the curve,AUC)为0.946;识别侧凸Cobb角≥20°时的AUC为0.951;DL算法还可以对侧凸Cobb角进行简单的分级(<10°、10°~<20°、20°~<45°、≥45°),准确度为80%;外部验证结果显示,DL算法在脊柱侧凸筛查、侧凸Cobb角≥20°病例的检测及侧凸严重程度分级方面均优于人工测量。学校脊柱侧凸筛查被认为是脊柱侧凸早发现和严重脊柱畸形预防的重要措施。波纹图像检查(moiré topography)能够描绘人体躯干的3D表面形态,已经被应用于脊柱侧凸的早期筛查[15]。Watanabe等[16]基于CNN创建了一个脊柱侧凸筛查系统,可以根据波纹图像预测侧凸Cobb角和椎体旋转度,并整理了1996例患者的波纹图像和脊柱全长正侧位X线片作为训练集,结果显示预测的Cobb角和椎体旋转度与标准测量结果相比平均绝对误差分别为3.4°和2.9°。Pan等[17]提出的一种CNN模型基于248例患者的胸部X线片进行Cobb角测量,与人工测量的Cobb角相比,组内相关系数为0.854,平均绝对误差为3.32°,结果显示该模型对胸部X线片Cobb角的测量具有良好的可靠性。相比X线检查,超声技术没有辐射且更加经济,Banerjee等[18]尝试利用3D超声进行脊柱侧凸的筛查,使用CNN对超声图像进行处理,以自动分割出脊柱中线,为下一步侧凸Cobb角的自动测量打下基础。Ungi等[19]开发了8个CNN模型,可以利用超声图像重建脊柱,并且实现了侧凸Cobb角的自动测量,应用于健康受试者的平均AUC为0.991,应用于脊柱侧凸患者的平均AUC为0.970。
3脊柱畸形的分型
脊柱畸形分型的确定对于手术规划具有重要意义,临床实践中确定患者的分型需要测量多个影像学参数,容易产生主观误差。ML使脊柱畸形的分型更加高效、准确,且ML技术从大量数据中挖掘信息的能力能够促进新分型方法的出现。
Lin等[20]纳入37例脊柱侧凸患者资料(训练集25例,测试集12例),通过脊柱正侧位X线资料训练的ANN模型实现了对脊柱侧凸的自动King分型,具有一个隐层的ANN模型准确度为75%,具有两个隐层的ANN模型准确度为83%。Adankon等[21]将不同类型主弯脊柱侧凸患者的躯干表面三维图像分割成小块的几何描述特征,训练了一种对主弯特征进行分类的ML模型。该方法避免了射线暴露,与标准人工分类相比总体准确率达到95%。为了简化AIS的分型方法,Thong等[22]开发了一种基于堆叠式自动编码器的ML模型,对663例AIS患者915次就诊时的正侧位X线片进行脊柱三维重建和分析,最终检测出11个亚组,新分型的不同亚组具有各自明显的影像学特征。
4脊柱畸形的治疗决策
治疗决策密切关乎患者治疗后的临床效果和生活质量。AIS和ASD患者可以选择非手术治疗或者手术治疗。对于脊柱矫形手术,选择合适的脊柱区域进行融合是一个具有挑战性的工作,需要在尽可能保留脊柱活动度的同时对脊柱畸形进行稳定的矫正。
Ames等[23]的研究纳入了570例ASD患者,采用层次聚类的方法开发了一种分类模型,该分类方法包含12个亚组,可以纳入并同时分析比现有分类方法更全面的人口学特征、衰弱因素、影像学和功能状态资料,通过构建术后2年的风险-收益评估系统来优化治疗决策。对于AIS患者,如何有效预测脊柱侧凸进展加重是一个重要的问题。在临床实践中,医师会根据患者的年龄、骨龄、月经状态、侧凸Cobb角和位置来评估脊柱畸形进展的可能,并以此来指导治疗[24]。Kadoury等[25]的研究采用流形学习的方法建立模型,根据AIS患者脊柱正侧位X线重建的脊柱三维模型预测脊柱畸形的进展情况,根据预测结果将AIS患者分为进展型和非进展型;该研究利用133名受试者的745次脊柱三维重建资料对模型进行测试,与实际结果比较,预测结果准确度为81%。
Kohonen神经网络,也被称为Kohonen自组织映射(self organizing map,SOM),已经成为图像识别和处理、机器人等领域的研究焦点。Mezghani等[26]纳入了1776例手术治疗的AIS患者,通过Cobb角的测量结果训练了一种SOM模型,用来确定Lenke分型和合适的融合区域选择之间的关系,结果表明合适的融合区域选择与Lenke分型的一致性达到88%,12%的不匹配结果发生在不同Lenke分型的边界处。通过更大样本的训练,有可能使该分型系统更加完善,更好地指导手术融合区域的选择。随后,使用Kohonen神经网络开发了一种高精度的AIS分型方法,结果显示1776例病例中,Lenke分型推荐的融合区域有46%实际被融合,而SOM模型推荐的融合区域有82%实际被融合,证实了SOM模型绕过传统分类的限制,从大量数据中挖掘相似的病例信息进行分析和整合,从而更好地指导治疗[27]。
5 ML辅助脊柱畸形手术操作
为了提高术中操作的准确度,已有多种ML方法被应用于术中辅助操作。随着人工智能技术的快速发展,已经实现了机器人辅助下椎弓根螺钉的置入。Hu等[28]在机器人辅助下为95例患者放置了椎弓根螺钉,其中大多数患者都存在脊柱畸形,共放置960枚螺钉,成功放置949枚,错位11枚,准确度为98.9%。椎弓根的定位和识别在脊柱矫形手术螺钉置入过程中有重要作用。Huo等[29]基于ML开发了一种自动椎弓根探测器,能够自动识别单个椎体模型中的椎弓根并绘制椎弓根轮廓,为椎弓根螺钉置入提供参考,防止螺钉偏移。该过程包括三个步骤:①对单个椎骨模型进行预处理以获得点云;②使用改进的Point-Net模型从单个椎骨点云中分割出椎弓根区域;③利用分割结果自动拟合椎弓根的横截面,最后生成椎弓根轮廓作为手术参考。对于大多数脊柱侧凸病例,椎体常有轴向旋转,置入椎弓根螺钉时应充分考虑这一点。Ebrahimi等[30]纳入了149例AIS患者和健康受试者,开发了一种基于ML技术的自动椎弓根探测器,能在正位X线片中计算椎骨轴向旋转角度,结果显示椎弓根中心定位的准确度为84%,与人工定位结果相比的平均差异为(1.2±1.2)mm,椎体轴向旋转角度平均差异为-0.2°±3.4°。该自动探测器有强大的椎弓根定位能力且人工调节量小,可以为椎弓根螺钉放置提供良好的参考。Forestier等[31]开发的一种ML系统能够根据术中情况预测外科医师在手术期间可能执行的下一个操作程序,准确度达到95%,当医师的操作偏离正常程序时,系统还能够发出报警信号,以保证手术的顺利进行。
6脊柱矫形手术治疗的并发症预测
脊柱矫形手术治疗的目的是提高患者生活质量,因此手术相关并发症尤其值得重视。任何意想不到的并发症都可能导致严重的不良结局,有必要于术前进行预测。
Yagi等[32]纳入了195例接受手术治疗的ASD患者,开发了一种随机森林算法,通过术前脊柱曲线、人口统计学资料和手术侵袭性等因素预测术后2年的主要并发症、再次住院情况和非计划性再手术情况,结果显示手术侵袭性、年龄、畸形严重程度和虚弱是主要并发症的最强预测因素,在测试集数据中预测的准确度为92%,AUC为0.963,在外部验证集准确度为84%。Kim等[33]以美国麻醉医师协会(American Society of Anesthesiologists,ASA)分级为基准开发了一种ML模型来预测ASD患者术后的心脏并发症、切口并发症、静脉血栓和死亡的发生率,共纳入4073例ASD患者,结果表明ANN和logistic回归模型在预测心脏并发症、切口并发症、静脉血栓和死亡的发生率方面均优于ASA分级,ANN模型在预测心脏并发症、切口并发症和死亡的发生率方面均优于logistic回归模型。
近端交界性后凸和近端交界性失败是ASD患者术后的常见并发症。Scheer等[34]纳入了557例ASD患者,使用C5.0算法和5种不同的自动化脚本模型构建了一组决策树,基于人口统计学资料、影像学资料和手术因素对ASD患者术后2年的近端交界性后凸和近端交界性失败进行预测,最终有20个变量被确定为最重要的预测因素,模型总体准确率为86.3%,AUC为0.89。Yagi等[35]纳入了145例接受手术治疗的ASD患者,使用C5.0算法和10种不同的自动化脚本模型构建决策树,对近端交界性失败的预测模型进行了微调,结果显示预测模型在测试样本中的准确率为100.0%,AUC为1.000,拟合效果良好。
7脊柱矫形手术的预后预测
通过对患者预后的判断,外科医师确定患者能否从治疗中获益,促进与患者的沟通和医疗决策的合理性。在脊柱矫形手术中,患者的预后通常是根据相关的影像学参数进行预测,然而可能还有很多其他因素影响复杂畸形的矫形效果。
Langlais等[36]建立的ML模型能够根据AIS患者术前的站立位、坐位高度和影像学参数预测患者术后身高的增长情况,验证队列中91%预测值的误差小于实际身高增长的一半。Ames等[37]建立的ML模型能够预测ASD患者术后1、2年的脊柱侧凸研究学会-22量表的得分,AUC为0.565~0.869,其中对于疼痛、残疾、社会功能和劳动能力相关问题的预测更加准确,对总体满意度、焦虑、抑郁和自我外观相关问题的预测则不太敏感。Zhang等[38]尝试多种ML算法用于预测后路脊柱融合术治疗ASD患者的住院时长,对1281例患者进行了分析,比较了5种常见的ML算法(包括logistic回归、决策树、随机森林、XGBoost和梯度提升算法)的预测效果,结果显示模型的准确度为68%~83%,AUC为0.566~0.821。Oh等[39]使用C5.0算法和5种不同的自动化脚本模型构建的决策树模型,能够基于人口统计学资料、影像学资料、健康相关生活质量和手术因素预测患者在术后2年恢复情况是否达到Oswestry功能障碍指数最小临床重要差异,结果显示模型总体准确度为85.5%,AUC为0.96,并且找到最重要的11个预测因子。
8 ML的局限性
ML技术在脊柱畸形诊疗过程中的应用无疑促进了医疗模式的转变,然而也应该考虑其局限性及存在的问题。
8.1数据源限制
ML模型的优秀程度受限于用于训练的数据质量和数量,而优质数据的获得存在很多困难。首先,对脊柱畸形患者的检查种类繁多,不同国家、地区甚至医疗单位之间存在差异,仪器设备的差异也会导致数据格式不一致,很难统一;其次,临床实践中难免存在漏诊、误诊、治疗错误等问题,这些数据应用于模型的建立势必会影响模型的准确性;最后,ML模型用于临床实践之前需要大量病例数据的训练,而具体需要多少病例,如何判定数据是否合格尚缺乏统一的标准。
8.2技术限制
ML在数据处理方面有着巨大的优势,但一些技术上的问题同样不可忽视。首先,大多数ML模型对用户来说都像一个黑盒,很难理解其内部的原理,导致一些错误结果无法进行识别[40];其次,ML方法种类繁多,不同方法之间差异很大,在临床实践中如何选择最合适的方法建立模型以解决实际临床问题非常重要,这需要多学科之间的交流合作。
8.3过度依赖问题
在临床实践中,虽然ML模型能够提供高准确度的临床指导,但临床医师仍需要分析其内在的医学含义。过度依赖ML系统会导致临床技能训练的不足,当临床医师的意见与系统意见矛盾时很可能会影响临床医师的自信心。Mazzant等[41]认为,在ML模型的推广应用中仍然需要强调外科医师在最终决策中的作用。
8.4伦理与法律问题
ML在脊柱畸形领域应用存在的伦理与法律相关问题也不容忽视。ML模型的开发需要大量的临床和影像学数据,数据的隐私和安全问题需要被考虑;数据收集、传输和储存所涉及的知情同意工作应受到重视。数据的匿名化已经被普遍提倡,患者应当保留对匿名数据的权利,这些数据的使用应该受到严格的规定,特别是当数据被用于盈利性目的时。ML模型无法做到完全准确,当临床应用中出现误诊、漏诊甚至治疗错误等问题时,法律责任应该如何划分需要提前规定。
9总结与展望
随着ML技术逐步运用于脊柱畸形的诊疗过程,势必会导致脊柱畸形传统诊疗模式发生变革。脊柱畸形患者的临床资料种类繁多、临床表现个体差异大,ML技术能够自动、高效、准确地处理庞大的数据,极大减轻了临床医师的工作负担,节约了医疗资源。各种各样的ML模型在脊柱畸形的筛查、治疗决策、辅助手术、预后预测等方面都展现出巨大的潜力。相信随着计算机技术的发展,ML技术将会被真正应用到脊柱畸形诊疗的各个环节,真正实现自动化、精准化、个体化医疗。在享受ML技术提供便利的同时,也应该看到ML技术存在的限制,开发过程中应注重保护患者的隐私和权利,应用过程中应强调临床医师的作用。同时,来自法律和伦理上的监管可能会限制ML技术的应用,但有利于其长远和稳定地发展。
【利益冲突】所有作者均声明不存在利益冲突
引自:杨程显,舒建川,于峥嵘,李淳德.机器学习在脊柱畸形诊疗中的应用与展望[J].中华骨与关节外科杂志,2023,16(06):571-576.
声明:此文内容及图片由供稿单位提供,仅供学习交流,不代表骨科在线观点。