2023盘点丨人工智能在脊柱外科中的研究与应用进展

来源：骨科在线 编号 : #139214#
2024-01-22 我要评论

自1956年达特茅斯会议上正式提出“人工智能”之初，医学便成为探索人工智能应用的主要领域之一。近十余年伴随算力的大幅度提高，深度学习算法的出现，以及数据量的爆炸式增长，人工智能在医学领域发表的论文数量呈指数量级增长（图1）。2022年11月30日，OpenAI发布了ChatGPT，其优秀的自然语言理解和生成能力进一步提供了人工智能在医学领域应用前景的巨大想象空间。本文就2023年人工智能在脊柱外科中的研究与应用进展进行盘点。

图1数据来源为PubMed

我们在PubMed上以“artificial intelligence”、“machine learning”、“deep learning”、 “computer vision”、“neural network”以及“spine”、“spinal”、“Cervical Vertebrae”、“Thoracic Vertebrae”、“Lumbar Vertebrae”、“Sacrum”、“Coccyx”、“Intervertebral Disc”等关键词进行检索，时间限定为2023年，共获得857篇文章，经人工筛选后纳入426篇相关文章，其中Original Research共345篇。本次盘点主要侧重于新的机器学习尤其是深度学习技术的开发以及在脊柱外科应用的原创性研究。

文献与计量分析

应用VOSviewer1.6.20对文献关键词进行共现与聚类分析（图2）。从方法学角度看，机器学习和深度学习频次最高，其算法仍然是研究的热点，而回顾性研究依然是最主要的临床研究设计方式。从研究的数据模态看，影像学数据为主流，其次是临床特征数据。影像学数据中主要为MRI和CT数据，其次是X线图像。从研究的解剖部位看，除脊柱整体外，腰椎研究最多，其次为颈椎研究。研究最多的五种疾病依次为骨质疏松、脊柱侧弯、脊柱骨折、脊髓损伤以及成人脊柱畸形。疾病的治疗结局/预后、生活质量、手术和诊断为人工智能的主要研究内容。算法或预测模型为人工智能研究的主要研究结果。

图2 文献关键词的可视化共现网络

论文最多的前五位国家分别为中国（92篇，包括中国台湾6篇）、美国（92篇）、德国（27篇）、韩国（25篇）、日本（24篇）。我国在该领域发文量和美国持平，平均被引用次数为0.62，稍低于美国（0.91），提示我国脊柱外科的研究者在人工智能方向的研究与美国的差距虽然不大，但研究质量仍有进一步提升的空间（图3）。得益于我国庞大的人群数量，一方面在可用于训练和测试的数据体量上有天然的优势，另一方面在研究转化上有广阔的应用市场和前景。

图3 2023年度中国及其他国家人工智能与脊柱外科发表文献数量情况

发表论文数量前五的杂志分别为Spine（19篇）、European Spine Journal（19篇）、The Spine Journal（17篇）、Global Spine Journal（16篇）、World Neurosurgery（10篇）以及Diagnostics（10篇）（图4）。

图4 2023年度主要杂志发表人工智能与脊柱外科相关文献数量情况

有7篇论文发表在影响因子高于10分的杂志（图5）。本文将基于脊柱外科专业相关的高影响力期刊论文，结合应用场景和模型功能的角度对文献进行盘点。

图5 2023年度人工智能与脊柱外科相关高显示度文献

分类任务模型

分类任务是人工智能模型进行决策的基础，目前在脊柱外科的诊疗研究中应用最为广泛，其一般应用场景包括术前的诊断、分型、手术评估，术中决策，术后结局及并发症的预测，以及风险因素评估等。在纳入的研究中，分类模型的开发仍然占据主流，并在算法和应用上不断创新。

Tavana等^[1]在Med Image Anal上发表了一篇关于自动分型的文章，比较了深度学习和传统机器方法在脊柱侧弯的分类中的应用。该研究采集了1000张脊柱正位X线图像，并将图像标记为C型和S型脊柱侧弯。然后比较KNN、SVM以及包含预训练权重的Xception和mobilenetV2联合SVM模型进行训练。结果提示通过自动特征提取、以SVM作为最终激活函数的预训练Xception和mobilenetV2网络比经典的脊柱曲率类型分类机器学习方法表现更好。

尽管在当前医学研究中，绝大部分深度学习模型需要输入医学影像进行诊断，但随着计算机视觉技术的不断进步，通过自然图像诊断疾病逐渐成为可能。Teng Zhang等^[2]在JAMA Network Open上发表了团队通过自然图像完成脊柱侧弯诊断的研究成果。研究应用背部照片进行模型训练及测试，测试集受试者工作特征曲线下面积(AUC)为0.839，并且能够很好地区分胸段、胸腰段、腰段及混合型侧弯，与两名医生相比在识别侧弯严重程度和曲度类型上具有更高的灵敏度。在识别侧弯曲度是否有进展的测试中，模型敏感性和阴性预测值与高年资医师水平相当，优于年轻医师。因此，该模型有潜力进行院外和无辐射的儿童脊柱侧弯管理，其性能与有经验的脊柱外科医生相当。

目标检测与分割模型

目标的检测与自动分割在执行特定的任务中均扮演重要的角色。检测模型可识别病灶位置，在分类任务中能够显著提高模型的性能，在手术场景下能够帮助手术医师快速识别病灶或重要的解剖位置（如血管、神经等）。在脊柱外科的研究中，目标检测更多作为一项复杂任务的中间步骤，如影像学分类前的自动框选，或者自动识别特定的解剖关键点，通过关键点的位置进行后续的研究。

Alexey Zakharov等^[3]发表在Medical Image Analysis上的研究，介绍其如何通过关键点检测获得的位置信息测量椎体高度，进而推算其骨折分型，整个预测算法的ROC曲线下面积≥0.95，并且能够在不进行任何训练或微调的情况下，在公开数据集上评估了椎体检测模型，并证明了方法的普遍适用性。

分割模型则更进一步，能够提供更加精确的位置信息，从而可以执行更为复杂的任务。随着计算机视觉技术的进步，分割算法趋于成熟，但分割在脊柱外科的应用仍在不断创新。Ting Sun等^[4]在Neuro-Oncology上发表研究，该研究基于U-Net架构，开发并训练髓内肿瘤的自动分割算法，并分别连接三个二分类模型，其作用是分别预测肿瘤总生存期是否大于1年、3年或5年，从而达到肿瘤预后的MRI全自动化评估。其得到的模型在1年、3年和5年的准确率分别为 86.0%、84.0% 和 88.0%，AUC 0.881、0.862和 0.905。整个模型实际实现了总生存期的4个分类的预测（小于1 年、1-3 年、3-5 年和5 年以上），其准确率为 75.3%。

Goller等^[5]在三维CT中应用基于卷积神经网络（CNN）的算法对椎体进行检测和分割，进而应用三维分割后的椎体数据获得三维纹理特征，根据特征建立模型鉴别椎体的良性骨折(骨质疏松性)和恶性骨折（恶性肿瘤）。分析发现良性骨折和恶性骨折之间的全局偏度存在显著差异。

影像配准

影像配准的目的是将不同时间、模态或来源的医学影像进行对齐，更准确地比较、分析和集成信息，协助完成复杂任务。在脊柱外科主要应用场景之一为术中导航，2023年在配准的算法上迎来了新的进步。Zhao等^[6]在Medical Image Analysis提出新型仿射弹性配准框架SpineRegNet，应用于椎间盘射频消融的手术规划和手术导航系统。

Liebmann等^[7] 提出了一种无标记的方法，以无辐射的方式自动解决腰椎融合手术的配准问题。作者在公开数据集上验证了配准方法，配准成功率的中位数为100%，靶区配准误差中位数为2.7 mm，螺钉轨迹误差中位数为1.6°，进钉点误差中位数为2.3 mm。此外，该方法在体外手术中也进行了验证，螺钉精度达到100%，靶区配准误差中位数达到1.0 mm。

自然语言处理（NLP）

2023年，脊柱外科在自然语言处理方面的研究的内容也在逐渐增多。Galbusera等^[8]利用现有的非结构化数据集与自然语言处理技术，从放射学报告中提取结构化信息，为大量腰椎放射学图像(N = 10287)生成标注，尽管报告和NLP预测存在噪声错误，但该技术能够大大缓解人工标注大量数据造成的资源与时间损耗，为大数据时代的人工智能研究开辟道路。

Krebs等^[9]应用NLP自动收集患者多项临床信息及MRI报告，并将这些信息数字化输入机器学习模型预测是否应当手术。同时作为比较，将临床信息输入logistic回归模型，应用logistic回归模型预测患者需要进行脊柱手术。结果提示简单的临床变量信息比使用NLP机器学习创建的变量信息预测性能更强，然而作者认为还需要更多数据进行研究来充分评估NLP对该分类任务是否有效。Kim^[10]和 Zaidat^[11]团队则致力于应用NLP自动识别当前操作术语集(CPT)代码，从而自动生成脊柱外科手术的计费账单，提高运营管理的效率。

生成式人工智能

自2022年底 GPT3.5及2023年GPT4.0的问世，大语言模型已成为人工智能领域最热门的研究方向之一。在脊柱外科研究中，一方面通过直接与GPT进行问答，评估其在解决特定问题的性能。Duey等^[12]通过评估GPT3.5和GPT4.0对脊柱外科患者血栓预防的建议，认为GPT3.5倾向于引用不存在的来源进行回答，但更有可能给出具体的建议，而GPT-4.0在其答案中更加保守。Stroop等^[13]通过组织有经验的脊柱外科医师与ChatGPT关于腰椎间盘突出的话题进行专业讨论，认为随着人工智能在沟通中的初步应用，大语言模型对患者会变得越来越重要。即使目前不太可能在医患之间的临床沟通中发挥作用，也应当对这种新技术的机遇和风险保持关注。

另一方面，随着生成对抗网络(GAN)和扩散模型的发展，生成式人工智能给基于影像的AI研究带来了帮助。Schonfeld和Veeravagu的研究^[14]证实了应用合成数据在下游模型训练研究中的可行性，作者应用SpineGAN生成的图像具有较高的FID和较低的精度评分（FID越低，图像相似度越高），但用于合成学习时能够具有较高的召回率和更高的性能。总的来说，应用合成数据学习可以创造出更大、更多样化的影像数据集来训练更具有泛化性的算法，并且能够更好地保护患者隐私。

此外，生成式AI还可以用于从二维X线到三维CT重建的实现。Saravi等应用GAN架构通过双平面X线图像重建 3D 脊柱结构^[15]。结果表明作者开发的算法有效，尽管在精细骨结构和椎骨的精确形态上存在局限，但该技术有希望提高X线的诊断能力，减少与CT扫描相关的辐射暴露和成本。

除了能够降低辐射外，生成式AI模型还可以应用自然图像生成可分析的医学影像学数据，实现脊柱疾病的无辐射评估，减少患者的辐射相关风险。Meng等^[16]应用深度学习开发能够在没有辐射的情况下准确量化AIS的模型，该模型功能包括关键点检测，应用改良后的GAN进行图像合成，以及根据合成后的图像预测Cobb角和脊柱侧弯的分型，研究者对模型进行了内部和外部验证，结果提示预测关键点与标注点误差小于4像素，基于合成图像的AIS严重程度分类，其敏感性和阴性预测值分别超过0.909和0.933，合成图像估测的Cobb角与真实值强相关（R²=0.984）。提示模型在关键点检测精度、合成图像质量以及分类和回归任务中均表现出良好的性能。

展望

1. 尽管人工智能在脊柱外科中的研究和应用数量在不断增加，但目前多为单中心回顾性研究，2023年度前瞻性研究占比仅为9.86%，多中心研究占比仅为6.09%，未来需要更多前瞻性、多中心的研究来进一步验证人工智能模型的性能。

2. 自然语言处理和生成式人工智能在脊柱外科中的应用目前较少，未来可能是创新的主要着力点之一。

3.即使在脊柱外科疾病的较小的范围内，也并未出现真正意义上的通用模型，随着技术的更新、法规的完善，以及多中心合作的加强，相信在不远的未来，脊柱外科领域也将实现能够完成多种任务的通用大模型。

结语

2023年我们见证了人工智能领域迎来的巨大变革。时至今日，AI研究仍是一片广阔的蓝海，站在2024年的起点，我们将面对前所未有的机会和挑战。期待新的一年里人工智能技术在脊柱外科有更多的创新增长点。以上为笔者对2023年人工智能在脊柱外科领域的研究与应用盘点，可能无法涵盖全部内容，如有遗漏，敬请谅解。

参考文献：

[1]TAVANA P, AKRAMINIA M, KOOCHARI A, et al. Classification of spinal curvature types using radiography images: deep learning versus classical methods [J]. Artif Intell Rev, 2023: 1-33.

[2]ZHANG T, ZHU C, ZHAO Y, et al. Deep Learning Model to Classify and Monitor Idiopathic Scoliosis in Adolescents Using a Single Smartphone Photograph [J]. JAMA Netw Open, 2023, 6(8): e2330617.

[3]ZAKHAROV A, PISOV M, BUKHARAEV A, et al. Interpretable vertebral fracture quantification via anchor-free landmarks localization [J]. Med Image Anal, 2023, 83: 102646.

[4]SUN T, WANG Y, LIU X, et al. Deep learning based on preoperative magnetic resonance (MR) images improves the predictive power of survival models in primary spinal cord astrocytomas [J]. Neuro Oncol, 2023, 25(6): 1157-65.

[5]GOLLER S S, FOREMAN S C, RISCHEWSKI J F, et al. Differentiation of benign and malignant vertebral fractures using a convolutional neural network to extract CT-based texture features [J]. Eur Spine J, 2023, 32(12): 4314-20.

[6]ZHAO L, PANG S, CHEN Y, et al. SpineRegNet: Spine Registration Network for volumetric MR and CT image by the joint estimation of an affine-elastic deformation field [J]. Med Image Anal, 2023, 86: 102786.

[7]LIEBMANN F, VON ATZIGEN M, STüTZ D, et al. Automatic registration with continuous pose updates for marker-less surgical navigation in spine surgery [J]. Med Image Anal, 2024, 91: 103027.

[8]GALBUSERA F, CINA A, BASSANI T, et al. Automatic Diagnosis of Spinal Disorders on Radiographic Images: Leveraging Existing Unstructured Datasets With Natural Language Processing [J]. Global Spine J, 2023, 13(5): 1257-66.

[9]KREBS B, NATARAJ A, MCCABE E, et al. Developing a triage predictive model for access to a spinal surgeon using clinical variables and natural language processing of radiology reports [J]. Eur Spine J, 2023.

[10]KIM J S, VIVAS A, ARVIND V, et al. Can Natural Language Processing and Artificial Intelligence Automate The Generation of Billing Codes From Operative Note Dictations? [J]. Global Spine J, 2023, 13(7): 1946-55.

[11]ZAIDAT B, LAHOTI Y S, YU A, et al. Artificially Intelligent Billing in Spine Surgery: An Analysis of a Large Language Model [J]. Global Spine J, 2023: 21925682231224753.

[12]DUEY A H, NIETSCH K S, ZAIDAT B, et al. Thromboembolic prophylaxis in spine surgery: an analysis of ChatGPT recommendations [J]. Spine J, 2023, 23(11): 1684-91.

[13]STROOP A, STROOP T, ZAWY ALSOFY S, et al. Large language models: Are artificial intelligence-based chatbots a reliable source of patient information for spinal surgery? [J]. Eur Spine J, 2023.

[14]SCHONFELD E, VEERAVAGU A. Demonstrating the successful application of synthetic learning in spine surgery for training multi-center models with increased patient privacy [J]. Sci Rep, 2023, 13(1): 12481.

[15]SARAVI B, GUZEL H E, ZINK A, et al. Synthetic 3D Spinal Vertebrae Reconstruction from Biplanar X-rays Utilizing Generative Adversarial Networks [J]. J Pers Med, 2023, 13(12).

[16]MENG N, WONG K K, ZHAO M, et al. Radiograph-comparable image synthesis for spine alignment analysis using deep learning with prospective clinical validation [J]. EClinicalMedicine, 2023, 61: 102050.

作者介绍

许南方

北京大学第三医院骨科教学主任助理

北京大学优秀青年医师

北京大学第三医院青年学术骨干

担任中国医师协会骨科医师分会数字骨科学组委员

颈椎外科研究会（CSRS）北美区分会通讯会员、CSRS中国分会教育委员会委员，发表第一作者/通讯作者 SCI 期刊论文 20余篇。

作者：许南方

单位：北京大学第三医院

声明：此文内容及图片由供稿单位提供，仅供学习交流，不代表骨科在线观点。

已评论0次

分享到：

2023盘点丨人工智能在脊柱外科中的研究与应用进展

2023盘点丨人工智能在脊柱外科中的研究与应用进展

来源：骨科在线 编号 : #139214# 2024-01-22 我要评论

请您登录后再评论

来源：骨科在线编号 : #139214#
2024-01-22 我要评论