9月2日,基础大模型(Foundation Model, FM)已成为医疗人工智能临床应用的核心驱动力,但三大关键瓶颈始终制约其从实验室走向真实诊疗场景。第一,现有医疗FM多依赖单模态数据训练,难以像临床医生那样融合多模态医学信息实现跨模态对齐,无法适配实际诊疗中“多影像协同诊断”的需求;第二,多数研究仅停留在回顾性数据验证阶段,缺乏覆盖多人群、多场景的前瞻性验证,更鲜有通过随机对照试验(RCT)这一金标准的检验,导致临床落地可行性与实际价值大打折扣;第三,医疗领域复杂的伦理、法律与社会挑战明确了AI的辅助定位,但现有研究多聚焦AI独立诊断能力,忽视了人机协作模式在真实临床流程中的实际意义和重要性。眼科学因常规应用多模态影像检查(如彩色眼底照、光学相干断层扫描等),成为突破上述瓶颈的理想领域。
近日,清华大学团队与上海交通大学医工交叉团队攻关,成功研发全球首个多模态视觉-语言眼部成像基础大模型EyeFM,并构建首个经临床验证的医疗AI大模型落地路线图,为大模型临床转化提供“可复制、可推广”的解决方案。
针对“如何通过眼成像刻画慢性病发展规律、赋能智慧诊疗”这一全球热点研究方向,研究团队依托超千万眼部影像及多模态诊疗数据,成功构建多模态眼成像基础大模型(EyeFM)。随后,团队通过云端协同模式前瞻性部署基于该大模型的数字化平台,并采用“人在回路”(Human-in-the-Loop)的临床验证设计,在全球不同地域(涵盖亚洲、北美、欧洲及非洲)的基层及眼科医生中,前瞻性验证了该大模型对诊疗能力的提升效果。与此同时开展了一项基于中国临床真实场景的随机临床研究,实现临床自适应的健康指导与智能交互服务。此次全球合作研究,首次为AI医学领域提供了大模型赋能基层与专科诊疗的高级别循证证据,同时为未来更多可临床转化的基础模型研发与验证提供了全新范式,有效推动该类新技术从实验室研究阶段迈向临床实际应用场景。
EyeFM为基于眼成像的AI大模型落地全球诊疗提供中国方案
研究成果以“眼成像基础大模型赋能临床诊疗:随机对照试验”(An eyecare foundation model for clinical assistance: a randomized controlled trial)为题,于8月28日发表于《自然·医学》(Nature Medicine)。
清华大学医学院教授黄天荫和上海交通大学计算机学院教授盛斌为论文共同通讯作者。清华大学八年制临床医学2017级学生吴漪澜,上海交通大学计算机学院钱波、李庭瑶,清华大学医学院秦义明,上海市交通大学医学院管洲榆,上海市保健医疗中心主任医师陈婷丽,美国俄勒冈健康与科学大学Yali Jia,美国俄亥俄州立大学张平以及清华大学医学院曾典为论文共同第一作者。研究得到北京市视觉科学与转化医学研究中心、新加坡国立眼科中心等机构专家的联合指导和支持。