国际期刊《自然·方法》刊发清华大学李梢团队研究
建立中西医影像-分子网络关系推断的统一AI模型
本报讯 (记者徐 婧)近日,清华大学北京市中医药交叉研究所所长、欧洲科学与艺术院院士李梢课题组在国际顶刊《自然·方法》(Nature Methods)发表了题为《基于统一多模态嵌入的病理形态与分子图谱系统解码》的研究论文。该文系统揭示出基于影像信息的中西医宏、微观跨层次网络模块化关联规律,创建了一套具有深度可解释性的影像-分子跨层次网络关系推断统一模型,实现了多尺度影像与多组学信息的跨层次从头推断与整合,并应用于发现疾病发生发展与药物干预的影像-分子多模态融合标志物,对于运用人工智能理解疾病宏微观复杂关联原理、推动中西医智能与精准防治具有重要意义。
理解人体复杂系统宏观信息与微观信息之间的跨层次关联规律,是中西医学面临的共性关键科学问题,对目前人工智能、系统生物学、网络药理学等前沿学科的发展也提出了重要方法学挑战。以病理图像等为代表的影像信息,既是疾病临床诊疗常用的金指标,也是耦合中西医宏观表型与微观分子的关键中间层次。如何通过嵌入影像信息来解析中西医宏、微观跨层次关联的底层规律,并构建具有普适性的人工智能模型,对于深入理解疾病发生发展与药物干预的本质、推动中西医临床精准诊疗,具有重要科学价值和现实意义。
该研究首先在中西医复杂体系宏、微观关联的本质规律发现上取得重要突破。该研究通过系统解析公共数据库中4.5万人次的临床信息、病理影像、分子多组学及空间转录组数据,构建了表型-影像-分子跨层次统一嵌入表征空间,进而率先揭示出基于影像信息的宏、微观“跨层次网络模块化”关联规律:宏、微观跨层次、跨模态数据可通过统一空间进行表征,且在该空间中形成网络模块化关联结构;以网络模块为核心单元进行数学建模,可完成跨层次网络关系推断与整合。这一规律的发现,为中西医复杂体系可解析、可计算奠定了理论基础。
在此基础上,该研究创建了影像-分子跨层次网络关系推断统一模型Multi-Embed,实现宏、微观跨层次关联的方法学突破。该模型基于自监督学习框架,从跨层次数据中自主挖掘病理影像与分子特征间的复杂关联,首次实现了多尺度病理形态与多层次分子图谱的跨模态统一嵌入,同时兼顾了模型的可解释性与泛化性,解决了传统多模态模型“性能与可解释性不可兼得”“泛化能力弱难以适配临床大队列”的两难问题。其优势体现在精度高、泛化能力强、深度可解释。
尤为突出的是,模型凭借嵌入的宏微观跨层次网络模块化先验,即便仅用少量空间转录组样本训练,也能生成适用于大规模临床数据的多模态共嵌入空间与整合模型,这为克服中医药领域常见的“小样本”局限、构建面向临床的中西医多模态学习模型提供了重要支撑。
进而,该文深入探究了Multi-Embed模型的临床应用价值。利用该模型系统解析了跨层次网络关键节点与肿瘤发生发展、药物干预疗效等临床结局之间的关联,发掘出一系列具有深度可解释性的影像-分子多模态融合标志物。研究结果展现出该模型在中西医智能与精准诊疗方面的重要价值,也为网络药理学驱动的肿瘤等复杂疾病防治科学发现提供了技术支撑。
《自然·方法》2004年创刊于美国,是生命科学领域方法学顶级期刊,专注发表全新实验技术、工具与重大方法改进,强调方法的创新性、通用性与可重复性。
(责任编辑:裴晴)



