国家蛋白质设施十年升级在即,迈向生命科学“数据生产力平台”

未来一天“智造”5000种蛋白质

来源:文汇报 作者:许琦敏 日期:2025-07-27
■本报记者 许琦敏

昨天,国家蛋白质科学研究(上海)设施迎来“十岁”生日。在当天举行的学术论坛上,该设施主任吴家睿介绍,作为全球首个生命科学领域的综合性大科学装置,蛋白质设施已成功建成蛋白质研究的综合性“三甲医院”,未来十年将拥抱“AI+”,建设生命科学“数据生产力平台”,实现蛋白质“智造”。

蛋白质研究“三甲医院”服务10万余人次

本世纪初,中国科学院院士饶子和富有远见地向国家提出:“蛋白质研究也需要大科学设施。”2009年,在各方推动下,国家蛋白质设施成功立项,选址上海张江。经过4年半建设,该设施于2015年7月28日通过国家验收正式开放运行,成为全球首个生命科学领域的综合性大科学装置。

吴家睿将蛋白质设施比作蛋白质研究的综合性“三甲医院”,能为蛋白质这个生命大分子提供综合研究手段。目前,该设施拥有九大技术系统,建立了从蛋白质样品制备、结构解析到功能研究的完整技术体系。

开放十年来,蛋白质设施已服务全国33个省级行政区的504家科研单位(含100多家科技企业),支撑超过2500个研究团队累计10万余人次用户开展实验研究。

迄今为止,蛋白质设施支撑完成科研课题超1.34万项,在原子空间尺度与毫秒时间尺度上深入解析蛋白质、核酸等关键生物大分子的结构与功能机制,发表高水平论文4000余篇,其中包括136篇《自然》《科学》《细胞》三大国际顶刊论文。

着眼于生命科学的长远发展,蛋白质设施与上海科技大学iHuman研究所、免疫化学研究所联合建设“中国蛋白质结构数据库”(PDBc)。2022年,PDBc正式加入国际蛋白质结构数据库组织,成为继欧美日之后第四个国家和地区成员,在世界蛋白质结构数据库的版图上点亮了中国地标。

目前,我国产出的结构生物学新数据占世界19%、亚洲65%,我国产出的实验结构数据已实现近100%由PDBc审校注释。

拥抱“AI+”,从结构认知到结构创造

“从多年前的一纸规划至今,张江已实现了大科学装置集群的跨越式发展。”饶子和对蛋白质设施的未来充满期望,“它将不断升级,为中国乃至人类的科学发展作出重要贡献”。

当前,生命科学研究正处于从“静态结构解析”迈向“动态功能建模”的关键转型期,AI技术为结构生物学带来范式跃迁。

面向“AI for Science”的全新时代,蛋白质设施正加速与AI深度融合,打造支撑未来蛋白质科学发展的关键“底座”,营造从“结构认知”到“结构创造”的全新国家大科学设施新生态,夯实我国在生命科学与生物技术领域的全球竞争力。

目前,蛋白质预测神器“阿尔法折叠”尚无法对蛋白质的动态结构进行预测。吴家睿介绍,蛋白质设施正系统布局蛋白质动态结构研究平台建设,同时引入AI驱动的模拟计算与构象预测技术,推动中国蛋白质研究“弯道超车”。

近期,蛋白质设施与上海思朗万维计算技术公司共建“AI蛋白质智造联合实验室”,引入国产自主可控的高性能分子动力学模拟计算平台,并与蛋白质设施九大技术系统协同升级,形成“AI建模+实验验证+动态结构还原”的融合式研究新范式。

“AI+生物”在合成生物学领域最为活跃,蛋白质设施也在积极布局“蛋白质智造”。目前,蛋白质设施将对PDBc数据库与计算框架进行升级,并携手康码生物联合打造全球首个高通量的从DNA到蛋白质的“蛋白质体外无细胞合成”智造装置。

吴家睿介绍,蛋白质设施将努力建设蛋白质智造的“闭环”,实现一天“智造”5000种人工设计蛋白。未来十年,蛋白质设施将从蛋白质研究“三甲医院”的1.0版,迈向生命科学“数据生产力平台”的2.0版。