6月2日,2022北京智源大会「AI赋能生命健康专题论坛」成功召开! 在 AI for Life Science 这一前沿研究领域,智源研究院作为论坛主席,邀约了一批最富洞见的中国学者,向每位带来精彩报告的嘉宾真诚道谢!
从研究前瞻聊到落地应用,一场酣畅淋漓的学术盛宴,令我们回味许久。
在新药研发面临反摩尔定律愈演愈烈的趋势下,AI辅助药物研发如何破新局?如何以先锋姿态勇闯科学前沿突破,同时亦能落地造福平凡日常一蔬一饭?
药物分子生成、AI 与营养健康、蛋白质预测、药物研发范式、基因调控……关于 AI + Life Science 的无尽探索可能,随着与会嘉宾充满激情的演讲,把我们的思绪拉回到2021年8月,智源研究院成立健康计算研究中心的那个夏天。
彼时,随着 AlphaFold 的横空出世,推动蛋白质结构预测突破新高度,人工智能照亮生命健康等基础科学领域,指引出另一条潜力可期的研究路径…
以人工智能和数据驱动的第四范式为生命科学基础研究提供了新可能——受到这一珍贵的科研机遇感召,我们奋然投身这一交叉领域研究,期待我们的点滴科研进展能够切实为这个世界带来稍许进步与美好:
或是帮助医疗行业加速传染病、罕见病、癌症等重大疾病解决方案的研究,或是帮助人们追寻生命的奥秘。
就这样,智源健康计算研究中心“开张”了,聚焦人工智能技术赋能生命科学领域研究:
不到一年,就吸引了一群志同道合的全职研究人员加入—— 他们中有来自微软亚洲研究院主管研究员、ICLR outstading paper得主、师从机器学习三巨头Yoshua Bengio的知名研究员,ACM金牌、来自Facebook的算法工程师等多位优秀人才。
以生物序列数据(DNA、RNA,蛋白质)为主要研究基础,我们尤其关注生物序列数据研究中的重要方面,如加速序列筛选,功能可控序列生成,三维结构建模预测和生成,复合物结合预测等,实现从0-1的新型药物设计。
传统药物研发是一个漫长而昂贵的过程,通常一款新药要花费超过十年、甚至二十年费用,更重要的是在临床测试阶段,通过三期测试的概率只有10%。在这些方面,人工智能技术大有可为:
药物研发领域积累了海量数据,包括科技文献、PDB公开数据、临床试验数据等,从海量数据中发现和总结规律,并用于结构和功能预测正是AI最精通的能力。
近年来,人工智能模型算法日益精进,在加速药物研发周期和提供成功率方面展现出巨大潜力。更重要的是,一旦AI辅助药物研发的“潘多拉魔盒”被打开,将在整个生命科学领域引发颠覆性变革,改变材料、化学、能源等多个基础学科的研究范式,加速相关重大课题的研究进程。
目前,智源健康计算研究中心取得了一些微薄进展:
01
众所周知,缺乏足够可供机器学习算法使用的数据,是AI解决生物学问题的关键瓶颈。如在RNA三维结构预测中,有结构的单体RNA只有1000个样本左右,不足蛋白质结构数据的1%。从第一性原理发出,采用量子力学计算模拟可能面临功耗过大,且无法进行大规模计算的问题。
基于此,团队提出使用粗粒化机器学习力场进行分子动力学模拟,并与结构预测等下游任务进行统一建模,将粗粒化模型模拟仿真作为隐式神经网络,实验端到端可微。该方法有希望将DNA、RNA、蛋白质结构模型用一套完整的原子层面进行表征,并与不同的下游任务联合进行端到端学习,从根本上解决数据孤岛和小样本难题。
02
在过去的一个月中,研究中心参加全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)获得第一名,初步展现了团队在生物计算领域的科研实力。
CAMEO由瑞士生物信息研究所和巴塞尔大学联合举办,与CASP竞赛共同被视为全球蛋白质结构预测领域最重要的两项比赛,每年吸引全球生物计算领域的顶级企业和科研机构在此角逐。这项竞赛要求参赛者每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,我们在IDDT关键指标上达到了85.8,击败Alphafold2模型。
03
研究中心积极在核酸适配体、小RNA药物、抗菌肽、基因编程等多个领域展开研究工作,将人工智能方法应用于领域内的问题上,并根据领域问题的特点优化机器学习算法与模型,均取得了不错的成绩。
此外,在新冠病毒核酸适配体研究中,我们找到了体外实现效果极佳的高潜力候选物,正在开展进一步的临床实验验证。
AI for Life Science 是典型的交叉研究学科,对研究人员有着更高的跨界要求,需要广泛的领域合作。智源模式为我们的科研进展提供有利的帮助。
缺少跨界人才一直是制约 AI 药物研发领域的关键因素之一:
团队建设发展,需要跨越学科背景带来的理解偏差和先天障碍。研究人员不仅要有深厚的机器学习背景,精通算法的构建与优化,还要对生命科学领域有兴趣和热情,有坚实的分子生物学与结构生物学专业知识。
大多数研究员都是纯机器学习背景出身,需要半年内快速从“一窍不通”成长为“半个领域专家”,除了兴趣驱动外,“智源模式”亦提供了良好的环境和丰富的资源。
在这一过程中,基于智源研究院跨越产学研的中立定位,我们得到了来自各方优势力量的支持:
依托充满活力的智源生态圈,健康计算研究中心已经与国内众多研究机构建立密切合作关系,包括清华智能产业研究院(AIR),清华大学计算机系、自动化系,北大计算机学院,人大数学学院以及海德堡大学等。不同院校、不同学科顶尖学者的交流、合作机会,为研究成果提供了丰沃的学术土壤。
研究人员有机会与顶尖学者交流学习,比如,清华大学药学院鲁白教授,成为很多项目的指导老师,从生命科学角度对计算机背景团队的跨界科研给与大力指导;通过青年人才俱乐部青源会,密切与海内外小同行互动切磋;借助产学界的合作项目,快速了解行业趋势和研究现状,为新课题提供重要指引……
我们的团队沐浴在自由、透亮的工作氛围里。我们最享受两个时刻,一个是和团队伙伴1V1聊研究进展,灵感激发着在白板上写下满满思路;另一个就是全组人结伴去食堂吃饭,聊聊家常,互相倾吐一下研究中的不容易和小坎坷——仿佛回到无忧无虑的大学生活。
我们是一个年轻的团队,每一天都充满了探索的激情与目标。
愿意给年轻人更多承担、锻炼的机会,愿意创造年轻人喜欢的“自由透气”的环境,这也是我们当初决心加入智源的理由:
相比“螺丝钉”的角色,我们更加渴望加入一个迅速发展的平台,承担更具成长性的角色,用青春的奋斗在科研简历上写下更有影响力的代表作!
我们相信,人工智能技术在AI药物研发、多组学数据分析、生物通路分析、可解释免疫原理研究、生物标志物发现等多个方向都有广泛的前景。
以人工智能推动生命科学领域的些许进步,将成为我们这个团队一段时间重要的主旋律。
畅想 AI for Life Science 下一个十年,我们都相信:
在不久的将来,一定能够在计算机里模拟整个生物体过程。
与有荣焉,我们和中国最优秀的科研同仁共同携手,交流、合作、探索。
我们最喜欢的一个环节,是论坛最后的圆桌讨论,每人要对十年后说一句话,这是我们对于当下与未来,滚烫的寄望。
也放在这封手记的最后,在时间的荒流中,用以自我鞭策。
畅想下一个十年,我们并不孤独,我们一起走到。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com