后AlphaFold时代,AI如何持续赋能蛋白质计算?

2022 年 6 月 6 日 中国科学院自动化研究所




CASIA


解锁更多智能之美

2018年12月,DeepMind 推出的 AlphaFold 根据基因序列成功预测蛋白质结构,成为 AI 技术驱动和加速科学发现的重要里程碑,引起业内广泛关注。2020年12月,DeepMind推出升级版本 AlphaFold 2,破解了蛋白质分子折叠问题,并宣称「它将改变一切」。2021年7月,DeepMind 宣布开源 AlphaFold 2 模型代码,并与 EMBL-EBI 合作开放 AlphaFold 蛋白结构数据库。

可以说,AlphaFold 与 AlphaFold 2 的相继推出拉开了人工智能与生物学交叉融合的序幕。但我们还应看到,由于自身的性能特点和巨大的内存消耗,AlphaFold 模型的训练和推理耗时长且成本高昂,这就要求学界对它既要借鉴又要创新。

后 AlphaFold 时代,国内在蛋白质预测领域也取得很多成就,比如在 CASP14 蛋白质测试集评估中仅次于 AlphaFold 2 的国产蛋白结构预测平台 TRFold 以及蛋白质结构预测模型的高效实现 FastFold 等。

人工智能技术与生物学的融合成为近年来的研究热点,尤其在蛋白质预测和药物设计方面。生物之外,在物理、数学、化学、材料、地质等多领域,AI 与基础科学相互影响并共同进步。

为更好地促进学术交流,尤其是交叉学科和前沿工作的同行交流,机器之心与中科院自动化研究所联合举办的「人工智能for基础科学系列论坛」第3期将于6月7日19:00-21:00在线直播

本次线上论坛以「后 AlphaFold 时代,中国蛋白质计算新进展」为主题,特邀中国人民大学数学科学研究院教授龚新奇主持,与多位领域专家共同分享交流,日程如下:


特邀主持人介绍

龚新奇:中国人民大学数学科学研究院教授、博士生导师、清华大学北京结构生物高精尖创新中心合作研究员、北京智源人工智能研究院特聘研究员、哈佛大学和IBM公司访问学者。研究生物信息学和机器学习方向的理论、方法和应用,已发表 SCI 论文 67 篇,被引 2600 多次,H 指数 25,发表期刊包括 Nature、Science等。主持国家自然科学基金等9个科研项目。目前为中国生物信息学会(筹)理事,中国运筹学会计算系统生物学分会理事,中国计算机学会高级会员、生物信息学专业委员,中国工业与应用数学学会数学生命科学专业委员会委员和金融科技专业委员会委员。


特邀嘉宾与主题介绍

分享主题:数据驱动的蛋白质设计

嘉宾简介:刘海燕,中国科学技术大学生命科学学院教授,「国家杰出青年科学基金」获得者。研究方向为蛋白质设计、蛋白质结构和动力学的计算机模拟方法与应用。已发表论文百余篇,包括在 Nature、Nat Method、J Am Chem Soc 以及 Phys Rev Lett 等杂志发表。

分享背景:蛋白质是地球生命中最重要的大分子之一。从原理上看,蛋白质分子的性质由其氨基酸序列(即不同类型氨基酸残基的排列顺序)决定。这带来了两个互逆的重要科学问题:其一为蛋白质结构和功能预测,即已知氨基酸序列,如何预测蛋白质的结构和功能;其二为蛋白质设计,即确定蛋白质应该具有什么样的氨基酸序列,才能满足我们对蛋白质结构和功能的预设需求。

分享摘要:我将分享我们发展的给定主链结构设计氨基酸序列的 ABACUS 模型,以及能在氨基酸序列待定时从头设计全新主链结构的 SCUBA 模型。SCUBA 采用了一种新的统计学习策略,从原始结构数据中得到神经网络形式的解析能量函数,能够高保真地反应实际蛋白质结构中不同结构变量间的高维相关关系。SCUBA 不需要用已有结构片段来拼接产生新结构,能够显著扩展从头设计蛋白的结构多样性,设计出不同于已知天然蛋白的新颖结构。我还将介绍基于深度学习和自洽迭代进行氨基酸序列设计的 ABACUS-R 模型,并分享深度学习应用于蛋白质设计的一些展望和思考。

相关链接:

A backbone-centred energy function of neural networks for protein design;https://www.nature.com/articles/s41586-021-04383-5

Rotamer-free protein sequence design based on deep learning and self-consistency; https://www.researchsquare.com/article/rs-1209166/v1

Protein design with a comprehensive statistical energy function and boosted by experimental selection for foldability;https://www.nature.com/articles/ncomms6330


分享主题:用计算机视觉技术理解细胞生命

嘉宾简介:杨戈博士,原卡内基梅隆大学生物医学工程和计算生物学助理教授和副教授。2019年入选中国科学院杰出海外人才引进计划,现任中国科学院大学人工智能学院长聘教授,中国科学院自动化研究所模式识别国家重点实验室研究员。

分享背景:细胞是构成地球生物体的基本结构和功能单元,例如每个人体由约37万亿个细胞组成。理解细胞生命过程对于理解生命的本质和研发治疗人类疾病的药物至关重要。细胞的生命过程由成千上万生物大分子之间的相互作用驱动,具有复杂的时空动力学行为。计算机视觉技术在理解细胞生命过程的时空动力学行为和揭示相关分子机制方面发挥了关键作用。近年来,深度学习技术的发展使得计算机视觉在性能上实现了突破性提升,推动了相关基础与应用研究特别是药物研发在范式方面的深刻变革和在效率方面的显著提升。

分享摘要:本报告将介绍面向细胞生命过程研究的计算机视觉核心技术,通过相关的代表性应用展示如何使用和创新这些技术理解复杂细胞生命过程的内在时空规律,进而驱动创新药物的研发。

中科院自动化所计算生物学与机器智能团队网页:

https://cbmi-group.github.io


分享主题:AI For Drug Design

嘉宾简介:宋乐博士是著名的机器学习和图深度学习专家,曾任美国佐治亚理工学院计算机学院终身教授、机器学习中心副主任,阿联酋 MBZUAI 机器学习系主任,蚂蚁金服深度学习团队负责人(P10)、阿里巴巴达摩院研究员,国际机器学习大会董事会成员,具有丰富的 AI 算法和工程经验。

自 2008 年起,宋乐博士在 CMU 从事生物计算相关的研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果,获得NeurIPS、ICML、AISTATS等主要机器学习会议的最佳论文奖。社区服务方面,他曾担任 NeurIPS、ICML、ICLR、AAAI、IJCAI 等 AI 顶会的领域主席,并将出任 ICML 2022 的大会主席,他还是同行评议期刊 JMLR、IEEE TPAMI 的副主编。

Google Scholar:

https://scholar.google.co.uk/citations?user=Xl4E0CsAAAAJ&hl=en

分享摘要:报告将立足生物制药行业的现状与发展挑战,深入探讨人工智能算法和理论如何在制药领域发挥作用及AI+生物制药方向的前沿探索。



观看方式

直播间:关注中科院自动化所哔哩哔哩直播间器之心机动组视频号,北京时间6月7日19:00开播。

中科院自动化所哔哩哔哩直播间👇

机器之心机动组视频号👇

交流群:本次直播有QA环节,欢迎加入本次直播交流群探讨交流。


往期回顾

机器之心与中科院自动化研究所与联合举办「人工智能×基础科学系列论坛」第二期以「深度学习中的数学优化问题」为主题,特邀北京大学数学科学学院教授李铁军主持,中国科学院自动化研究所研究员张兆翔、杜克大学三一文理学院计算机科学系副教授鬲融、斯坦福大学计算机科学与统计学系助理教授马腾宇共同分享交流。

点击阅读原文即可查看往期回放!






欢迎后台留言、推荐您感兴趣的话题、内容或资讯!

如需转载或投稿,请后台私信。

登录查看更多
0

相关内容

AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
专知会员服务
12+阅读 · 2022年8月1日
AlphaFold教程与最新蛋白质结构预测进展,附视频与Slides
专知会员服务
24+阅读 · 2022年6月16日
智能遥感:AI 赋能遥感技术
专知会员服务
73+阅读 · 2022年5月29日
高性能计算专家Jack Dongarra获2021年图灵奖
专知会员服务
16+阅读 · 2022年3月30日
【百图生科宋乐博士】 人工智能赋能医药研发
专知会员服务
27+阅读 · 2022年3月17日
DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告,42页ppt
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年8月31日
国家自然科学基金
0+阅读 · 2012年2月28日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
15+阅读 · 2022年6月14日
Arxiv
14+阅读 · 2021年8月5日
Arxiv
12+阅读 · 2021年7月26日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
Arxiv
15+阅读 · 2018年6月23日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年8月31日
国家自然科学基金
0+阅读 · 2012年2月28日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Top
微信扫码咨询专知VIP会员