健心知著 | 基于多任务深度学习的全自动人工智能辅助超声心动图解读

健心知著

2025.12.24

640 (20).png

基于多任务深度学习的全自动人工智能辅助超声心动图解读

640.png

刘健、周海燕、孙宇彤

北京大学人民医院

健心荐语

超声心动图是心血管诊疗的关键手段,每年仅美国检查量即超750万例,推动医疗支出持续增长。然而,该检查高度依赖专家解读,而专业资源稀缺且报告存在显著主观差异,已成为临床广泛应用的突出瓶颈,尤其随着手持超声设备日益普及,这一矛盾更为凸显。当前人工智能虽已逐步应用于自动化分析,但多数仅支持单视图、单任务,无法模拟真实临床中融合多视图、多模态进行综合评估的复杂流程。因此,亟需开发能够高效、准确处理多视图、多任务的一体化AI系统,以实现不依赖人工的标准化、规模化超声心动图表型分析,而此类系统目前尚属空白。

文章介绍

本研究旨在开发并评估一种人工智能系统在经胸超声心动图(TTE)的39项全面标签和测量指标上的准确性。本研究涵盖了一款AI系统的开发及其回顾性、多中心验证工作。PanEcho是基于TTE研究开发的,该研究2016年1月至2022年6月期间在耶鲁纽黑文卫生系统医院和诊所进行。从2022年7月至12月,该模型在一个时间上不同的YNHHS队列中进行了内部验证,在4个不同的外部队列中进行了外部验证,并公开发布。该研究于2025年7月正式发表于美国医学会杂志《JAMA》。

研究方法

本研究的模型开发和内部验证的数据来自2016—2022年在耶鲁纽黑文卫生系统(Yale New Haven Health System,YNHHS)医院常规临床治疗期间进行的经胸超声心动图(transthoracic echocardiography,TTE)研究。本研究包括所有超声心动图切面的二维灰阶和彩色多普勒视频。YNHHS队列被分为开发集和验证集,2022年7月至2022年12月的研究被作为不同时间的内部验证集。为防止数据泄漏,将2016年1月至2022年6月的研究从所有验证集患者中剔除后用于模型构建。开发集在患者水平被随机分为训练集(92.5%)和调优集(7.5%)用于模型训练。

本研究包括4个外部验证队列:RVENet+、POCUS(床旁超声)、EchoNet-Dynamic、EchoNet-LVH,代表了广泛的表型,具有跨时间和地域的标准和即时超声心动图检查结果。RVENet+队列包括2013—2021年在匈牙利布达佩斯Semmelweis大学心脏和血管中心进行的完整超声心动图研究,包括所有可用的2D视图。如前所述,该队列由7个不同的亚群组成,包括精英运动员和心脏移植受者,代表了一个多样化的人群。该队列接受了与YNHHS队列相同的去识别和前处理步骤。

640 (1).png

图1:人工智能(AI)系统模型开发与研究设计流程

640 (2).png

640 (3).png

表1:内部和外部验证队列的描述

研究结果

本研究提出的AI系统在多中心验证中展现了全面的优异性能。在内部验证中,该系统完成了18项诊断分类任务,其中位AUC为0.91(IQR:0.88-0.93);同时完成了21项超声参数估计任务,其中位标准化平均绝对误差为0.13(IQR:0.10-0.18)。具体而言,该系统准确估算了左心室射血分数(内部平均绝对误差:4.2%;外部:4.5%),并有效检测出中重度或更严重的左心室收缩功能障碍(内部AUC:0.98;外部:0.99)、右心室收缩功能障碍(内部AUC:0.93;外部:0.94)以及重度主动脉瓣狭窄(内部AUC:0.98;外部:1.00)。在模拟的简化经胸超声心动图检查中,该系统仅使用关键切面视频即完成了15项诊断任务,中位AUC为0.91(IQR:0.87-0.94);而在来自耶鲁纽黑文健康系统急诊科的真实世界床旁超声检查图像上,它完成了14项任务,中位AUC为0.85(IQR:0.77-0.87)。

640 (4).png

图2:多任务分类性能评估

640 (5).png

图3:多任务回归性能评估

640 (6).png

图4:特定任务视图相关性

640 (7).png

图5:PanEcho模型在两种简化临床场景下的诊断分类表现

对于YNHHS、RVENet+和POCUS队列的每项研究,研究团队共同审查并定义了39项关键报告任务的列表,代表了各种分类结果和连续测量值,涵盖了超声心动图报告的所有主要内容。这包括18项分类任务,如所有4个心腔的大小、结构和功能以及瓣膜疾病,以及21项对每个心腔的关键维度、血流速度等进行量化的回归任务。标签从当地的电子超声心动图报告系统中提取,反映了经认证超声心动图医师确认的最终测量和报告。所有解读均根据美国超声心动图学会的标准指南进行,并由超声心动图医师决定。

结  论

本研究证实,无论是基于完整的诊断性检查,还是在有限的切面条件下,该超声心动图自动解读AI系统均能跨越地域和时间的差异,保持高水准的诊断准确性。这一特性使其具备广泛的临床应用潜力:该系统不仅可作为超声心动图实验室的高效辅助阅片工具,提升专业医生的工作效率与诊断一致性;在经过相应临床工作流程的前瞻性评估后,亦有望成为床旁场景下的AI辅助筛查手段,为缺乏专业超声医师的基层医疗和即时诊疗场景,提供可靠、可及的心血管初步评估支持。

讨论

本研究的讨论部分指出,新开发的AI系统PanEcho代表了心脏超声AI领域的一个重要进展。它通过一个创新的、能够灵活整合多视图的深度学习模型,克服了以往大多数AI工具只能处理单一视图或执行单一任务的局限。该系统在包含超过一百万段视频的庞大、多样化数据集上完成训练,并在横跨欧美多个医疗中心以及从标准超声室到急诊室床旁的不同场景中进行了严格验证,证明了其不仅对完整检查的分析高度准确,在视图有限的简化检查或由非专家操作获取的图像上也能保持可靠的性能。这一技术突破具有明确的临床转化潜力。PanEcho可以作为高效的“辅助阅片员”,增强了在资源有限环境下进行及时心血管疾病筛查与初步诊断的能力,有助于缩短诊断时间,使更多患者受益。

当然,当前系统也存在若干局限性。例如,模型目前主要基于二维灰阶和彩色多普勒视频,尚未整合频谱多普勒、三维超声等更先进的模态,这限制了其在某些特定评估上的能力。此外,作为一个直接输出数值结果而缺乏显式解剖分割步骤的“黑箱”模型,其决策过程的可解释性对于获得临床医生的完全信任仍是一个挑战,患者的最终诊断必须由临床医生结合完整的病史、体格检查及其他检验检查结果来综合做出。任何AI工具的引入,其核心目标都是增强医生的能力,而非取代其专业的综合判断。

总之,PanEcho的研发与验证标志着心脏超声分析向全面自动化迈出了坚实的一步,但其真正的临床价值,仍有待于在未来将其嵌入实际工作流程的前瞻性研究中。

阅读数: 110