结合人工智能,复旦科学家发现26个疾病相关药物治疗新靶点,成果刊《细胞》

大规模蛋白质组学研究能够深化对健康和疾病的理解,但蛋白质与健康和疾病之间的关系仍然存在许多未解之谜。蛋白质能否作为疾病预测和诊断的生物标志物及潜在治疗靶点?

复旦大学附属华山医院郁金泰、毛颖团队联合复旦大学类脑智能科学与技术研究院程炜、冯建峰团队联合攻关全面绘制了人类健康与疾病蛋白质组图谱结合人工智能大数据分析方法构建疾病诊断预测模型,发现了26个药物治疗新靶点为精准医疗和新药开发提供了重要科学依据。相关成果以《健康与疾病血浆蛋白质组图谱》为题于北京时间11月22日,在《细胞》(Cell)杂志发表。

这项研究绘制的人类健康与疾病蛋白质组图谱揭示了血浆蛋白在疾病诊断、预测和治疗中的潜在应用价值。同时,该研究也为临床实践提供了科学依据,有助于疾病的早期检测、精准分层和个性化治疗。

随着全球人口的快速增长和老龄化,健康需求和疾病负担日益增加。疾病预防和治疗面临的主要挑战包括缺乏可靠的个体化风险预测模型以及现有治疗方法的疗效和不良反应仍有待改善,突显了精准医学的重要性。基于基因组学的精准医学研究已取得初步成效,但基因转录和翻译过程的复杂性阻碍了因果基因的识别,进而限制了精准医学的发展。蛋白质能够直接反映人体的生物过程和病理变化,是理解疾病机制和开发新疗法的关键。

郁金泰教授和程炜教授多学科融合交叉团队敏锐觉察到蛋白质组学研究对阿尔茨海默病(AD)预防、诊断和治疗的意义,先后通过血浆及脑脊液蛋白质组学研究发现了AD新的诊断生物标志物,联合诊断精度高达98.7%。系列成果早期发表在国际顶级期刊,并受到《自然》主刊的高度评价。在前期蛋白质组学研究的基础上,团队发现,尚缺乏全面的健康与疾病蛋白质组图谱,而这引出了许多尚未解决的问题。例如,前期所发现的AD相关蛋白质是否特异性地与AD相关,抑或同时与其他疾病有关联等?

此次刊登的研究通过深入分析53,026名个体的血浆蛋白质组数据,跨越了14.8年的中位随访期,建立全面的蛋白质组图谱。该图谱涵盖了2,920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关表型,揭示了168,100个蛋白质-疾病关联和554,488个蛋白质-表型关联。

研究发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现加深了我们对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异,为精准诊疗提供了科学依据。

研究还发现免疫系统相关通路在绝大部分疾病中富集,强调了炎症在人类健康中的重要作用。此外,不同疾病间生物学通路的比较分析,完善了对疾病病理生理学相似性和异质性的理解。例如,AD和血管性痴呆(VaD)相关的蛋白质在与神经系统相关的共同通路中富集,而AD特异性通路大多与脂质代谢有关,VaD特异性通路与心肌有关。

利用蛋白质组学特征对660种疾病进行聚类,能够根据其共享的生物学特性将这些疾病联系起来,从而重新审视疾病的类别和亚型。例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学通路,将生物学上相关的疾病联系在一起,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对疾病机制的理解和提高治疗的有效性。

研究利用人工智能与大数据分析技术,识别出了具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值超过0.80,明显优于基于人口统计学的模型,将有助于提高疾病的早期诊断精度。

为进一步推动科学研究和精准医疗的发展,研究还建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas。这个数据库不仅有助于科学家们更好地理解疾病的生物学机制,还将加速疾病生物标志物的识别、预测诊断模型和治疗靶点的开发,为精准医学的实施提供强有力的支持。未来,基于这一开放获取的蛋白质组学图谱,研究人员将能够更深入地探索疾病发病机制,推动生物标志物和预测/诊断模型开发,并探寻全新治疗靶点,为精准医学发展奠定了基础。

复旦大学附属华山医院博士生邓悦婷、复旦大学类脑智能科学与技术研究院青年研究员尤佳等为共同第一作者。复旦大学附属华山医院郁金泰、毛颖教授,复旦大学类脑智能科学与技术研究院程炜、冯建峰教授为论文共同通讯作者。该研究得到了科技创新2030“脑科学与类脑研究”重大项目、国家重点研发计划、国家自然科学基金等经费支持。

本文作者:顾泳