成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
11倍加速蛋白质单体与复合物的结构预测!Colossal-AI团队联合百图生科开源xTrimo Multimer
2022 年 8 月 23 日
机器之心
机器之心报道
机器之心编辑部
相比现有方案,Colossal-AI 团队联合百图生科的这项研究,推理速度最高提升约 11 倍!
近日,Colossal-AI 团队( https://github.com/hpcaitech/ColossalAI )联合百图生科成功加速蛋白质单体与复合物的结构预测,行业内最前沿的同时支持蛋白质单体(Monomer)与复合物(Multimer)结构预测的 xTrimo Multimer 模型已免费开源,
相比现有方案,推理速度最高提升约 11 倍
!
本次解决方案背后优化加速技术来自 Colossal-AI,这是一个旨在全面助力 AI 大模型工业化应用的通用深度学习系统。xTrimo Multimer 开源版模型通过引入 Colossal-AI 的大模型优化技术,显著降低蛋白质结构预测模型训练和推理的时间和经济成本,提高蛋白质结构预测模型领域的设计和部署效率,是
Colossal-AI 系统在 AI 大模型 & 生物医药领域落地应用的重要实践
,使得在该领域训练和使用更大的模型成为可能。
该项目已在 GitHub 上免费开源:https://github.com/hpcaitech/ColossalAI/#xTrimoMultimer
Colossal-AI 是一个面向大模型时代的通用深度学习系统。自开源以来,Colossal-AI 不仅在数个月内获得近五千颗 Github Star,多次登上 GitHub Trending 榜首,相关解决方案也已成功在
生物医药、自动驾驶、云计算、零售、芯片等行业知名厂商落地应用
,广受好评。此次携手百图生科,利用双方在高性能计算和生物计算领域上前沿的技术积淀,提出蛋白质单体与复合物的结构预测加速方案,进一步共同打造繁荣的生物计算生态,精准高效地探寻癌症、衰老等疾病的免疫规律,逐一攻破 AI 技术在靶点挖掘、创新药物设计落地应用上的难关,让更多疾病可预警、可控制、可治愈。
众所周知,蛋白质结构预测是结构生物学领域最为重要的课题之一,也是我们理解基因翻译和蛋白质功能的重要手段。蛋白质之间的相互作用,是蛋白质发挥生物学功能的重要结构基础。但是由于蛋白质的多级结构和复杂的相互作用,使得精确预测三维结构这一关键问题十分有挑战性。
近年来,深度神经网络的成功使得人工智能在各个领域得到了广泛的应用。自 DeepMind 发布的 AlphaFold 能够实现根据氨基酸序列精准预测蛋白质结构以来,生命科学领域掀起了使用人工智能预测蛋白结构的热潮。
AlphaFold 能够实现端到端的从序列直接预测单体蛋白质三维结构,但在生物体内,多数蛋白质是以复合体的形式来发挥功能的。因此,为了打破 AlphaFold 仅在预测单体蛋白方面表现优异的局限,DeepMind 后来也发布了用于预测蛋白复合体结构的 AlphaFold-Multimer 模型。
早在 2022 年 3 月,Colossal-AI 团队曾推出蛋白质结构预测模型 AlphaFold 的训练推理加速方案 FastFold,用更低的成本将总体训练时间从 11 天减少到 67 小时,在长序列推理应用中实现超 11 倍的提升。以此为起点,Colossal-AI 团队在蛋白质结构预测领域的技术革命正在延续。
针对蛋白质单体 (Monomer) 与复合物 (Multimer) 结构预测的难题,本次 Colossal-AI 团队联合百图生科提出行业内最新解决方案 xTrimo Multimer 开源版模型,能够更好地理解蛋白互作关系,从而提升药物研发平台中靶点分析、蛋白质结构预测和模拟以及高精准抗体设计等方面的能力。
此外,推理阶段昂贵的经济和时间成本使得 AlphaFold 模型相关的研究和开发十分困难,尤其是面对长序列推理时,计算复杂度和内存消耗都面临着巨大挑战。xTrimo Multimer 开源版模型针对 AlphaFold-Multimer 模型中的计算特性,进行了针对性的 CUDA 优化,并且进行了 Kernel Fusion。相较于 AlphaFold2 和哥伦比亚大学的 OpenFold,xTrimo Multimer 开源版模型在单卡推理上性能有明显提升 ,推理速度分别提高 1.58~2.14 倍和 1.14~2.23 倍。
xTrimo Multimer 开源版模型还支持超长序列的分布式推理。由于使用了动态轴并行(Dynamic Axial Parallelism)技术,xTrimo Multimer 可以高效地将计算和部分显存分配到不同的设备上,从而解决超长序列面临的计算和内存挑战。在 2K 到 3K 的序列长度下,xTrimo Multimer 使用多卡进行推理,相对于 OpenFold 和 AlphaFold 2 推理速度最高提升 8.47 倍和 11.15 倍,对比 Uni-Fold2.0 速度最高提升 4.45 倍。xTrimo Multimer 可以支持长达 4K 的序列推理,此时 OpenFold 和 AlphaFold 2 受限于显存无法完成推理,而 xTrimo Multimer 可以在 20 分钟左右完成。
百图生科首席 AI 科学家宋乐表示:“从对单个蛋白质结构的模拟,到对不同蛋白质之间的相互作用的识别,再到对蛋白质复合物的绘制,百图生科致力于解码、建模复杂人体免疫系统,开发突破创新药物,编程免疫系统,治愈多种免疫相关疾病。此次 xTrimo Multimer 开源版模型的发布,是我们携手潞晨科技 Colossal-AI 团队,借助其在高性能计算上的优势以及百图生科生物计算领域前沿的技术积淀,朝着百图生科 xTrimo 多模态生物计算大模型体系迈出的又一步。正如我们一直以来所努力的方向,精准高效地探寻癌症、衰老等疾病的免疫规律,逐一攻破 AI 技术在靶点挖掘、创新药物设计落地应用上的难关,让更多疾病可预警、可控制、可治愈!”
潞晨科技创始人尤洋教授表示:“ 此次 Colossal-AI 团队与百图生科合作的蛋白质单体与复合物结构预测最新方案,是面向大模型时代的通用深度学习系统 Colossal-AI 在生物医药领域应用落地的重要进展。未来我们双方将会继续在生物计算大模型上有更深入的合作,助力深度学习在创新药物研发上的应用和落地。”
随着人工智能对各个领域的高度渗透,各行业的智能化产业转型升级都离不开高性能 AI 的加持,潞晨对于 AI 大模型的高效训练和推理方案是未来 AI 市场的刚需。Colossal-AI 致力于构建针对 AI 大模型的完整生态系统,针对不同行业的需求提供智能化、一体化的高效灵活解决方案,切实有效解决企业 AI 大模型产品落地的关键痛点,为全产业链赋能。
关于百图生科
百图生科 (BioMap) 是生物计算引擎驱动的突破创新药物研发平台, 由百度创始人李彦宏发起创立, 致力于将先进 AI 等信息技术 (IT) 与前沿生物技术 (BT) 相结合, 构建独特的靶点挖掘及药物设计能力, 聚焦于解析免疫调控机理, 开发创新的治疗性药物, 造福人类健康。目前公司拥有近万平米的实验室,50 + 个靶点及药物研发资产组合。
关于潞晨科技
潞晨科技致力于解放 AI 生产力,打造面向大模型时代的通用深度学习系统 Colossal-AI ,高效促进 AI 大模型落地应用。核心成员来自美国加州伯克利、斯坦福、清华、北大、新加坡国立、南洋理工大学等世界一流高校,在国际顶级学术刊物或会议共发表论文近百篇,曾在谷歌、微软、NVIDIA、IBM、英特尔等头部科技公司任职。公司成立即获得位列 “清科中国早期投资机构 30 强” 榜首的创新工场、真格基金超千万元种子轮投资。
传送门:
Github 地址:https://github.com/hpcaitech/ColossalAI/#xTrimoMultimer
https://github.com/hpcaitech/ColossalAI
图片来源:
https://www.technologyreview.com/2021/07/22/1029973/deepmind-alphafold-protein-folding-biology-disease-drugs-proteome/
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
复合物
关注
0
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
10+阅读 · 2022年8月28日
Bioinformatics | 结构类似物导向的蛋白质结构域深度学习组装方法
专知会员服务
3+阅读 · 2022年8月25日
加速构建蛋白质元宇宙!分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代
专知会员服务
5+阅读 · 2022年8月11日
AI算法 | 神经网络从深度突变扫描数据中学习蛋白质序列-功能关系
专知会员服务
4+阅读 · 2022年8月6日
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
专知会员服务
13+阅读 · 2022年8月1日
Cell专刊|AI在蛋白结构、精准医疗、抗体疗法[综述]等的应用与未来预测
专知会员服务
16+阅读 · 2022年7月24日
Nat Rev Mol Cell Bio|用人工智能预测蛋白质结构的前景和机遇
专知会员服务
17+阅读 · 2022年5月1日
【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术,State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold
专知会员服务
20+阅读 · 2022年3月14日
【AI4Science】利用人工智能加速科学发现- DeepMind-CEO Demis Hassabis最新演讲视频报告
专知会员服务
28+阅读 · 2022年3月7日
【Nature子刊】ProteinGAN使用生成式对抗网络生成蛋白质变体,加速药物研发
专知会员服务
25+阅读 · 2021年4月6日
比AlphaFold2快10倍!国产开源项目加速蛋白质预测,超长序列22分钟就搞定
量子位
0+阅读 · 2022年8月23日
地球超2亿蛋白质结构全预测,AlphaFold引爆「蛋白质全宇宙」!
极市平台
0+阅读 · 2022年7月29日
世间几乎所有已知蛋白质结构,都被DeepMind开源了
机器之心
0+阅读 · 2022年7月29日
无缝支持Hugging Face社区,Colossal-AI低成本轻松加速大模型
机器之心
2+阅读 · 2022年7月13日
让所有人都能做蛋白质结构预测,华为昇思 MindSpore 最新成果将开源
机器之心
0+阅读 · 2022年7月8日
后AlphaFold时代,AI如何持续赋能蛋白质计算?
中国科学院自动化研究所
0+阅读 · 2022年6月6日
推理加速GPT-3超越英伟达方案50%!最新大模型推理系统Energon-AI开源,来自Colossal-AI团队
量子位
0+阅读 · 2022年5月31日
快80~500倍!人工智能快速预测两种蛋白质的结构互作方式
机器之心
1+阅读 · 2022年2月19日
基于异构网络的致病基因及其复合物预测方法研究
国家自然科学基金
0+阅读 · 2015年12月31日
G蛋白偶联受体结构及与药物配体结合的计算研究
国家自然科学基金
0+阅读 · 2015年12月31日
基于结构域的蛋白质-RNA相互作用预测模型构建
国家自然科学基金
0+阅读 · 2014年12月31日
基于多尺度系统生物学的药物-副作用相互作用网络预测研究
国家自然科学基金
0+阅读 · 2013年12月31日
自相互作用蛋白质的系统研究和预测
国家自然科学基金
2+阅读 · 2012年12月31日
真核转录延伸复合物因子的结构生物学研究
国家自然科学基金
0+阅读 · 2011年12月31日
应用机器学习方法预测和分析蛋白质的结构柔性
国家自然科学基金
4+阅读 · 2010年12月31日
de novo预测蛋白质结构的并行元启发方法研究
国家自然科学基金
0+阅读 · 2009年12月31日
真核基因转录后调控过程相关蛋白质及其复合物的结构生物学研究
国家自然科学基金
0+阅读 · 2009年12月31日
病原细菌鞭毛蛋白质复合物三维结构和功能关系的研究
国家自然科学基金
0+阅读 · 2009年12月31日
Generating 2D and 3D Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution
Arxiv
0+阅读 · 2022年11月28日
Cross-Domain Ensemble Distillation for Domain Generalization
Arxiv
1+阅读 · 2022年11月25日
Question Answering and Question Generation for Finnish
Arxiv
0+阅读 · 2022年11月24日
Semantic Communication Enabling Robust Edge Intelligence for Time-Critical IoT Applications
Arxiv
0+阅读 · 2022年11月24日
Backdoor Attack and Defense in Federated Generative Adversarial Network-based Medical Image Synthesis
Arxiv
0+阅读 · 2022年11月24日
CSCD-IME: Correcting Spelling Errors Generated by Pinyin IME
Arxiv
0+阅读 · 2022年11月24日
COCO-DR: Combating Distribution Shifts in Zero-Shot Dense Retrieval with Contrastive and Distributionally Robust Learning
Arxiv
0+阅读 · 2022年11月24日
Complexity Framework For Forbidden Subgraphs
Arxiv
0+阅读 · 2022年11月23日
Data Augmentation for Graph Neural Networks
Arxiv
38+阅读 · 2020年12月2日
Conditional Random Field and Deep Feature Learning for Hyperspectral Image Segmentation
Arxiv
11+阅读 · 2017年12月27日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
复合物
结构
AI
蛋白质结构预测
AlphaFold
生物
相关VIP内容
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
10+阅读 · 2022年8月28日
Bioinformatics | 结构类似物导向的蛋白质结构域深度学习组装方法
专知会员服务
3+阅读 · 2022年8月25日
加速构建蛋白质元宇宙!分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代
专知会员服务
5+阅读 · 2022年8月11日
AI算法 | 神经网络从深度突变扫描数据中学习蛋白质序列-功能关系
专知会员服务
4+阅读 · 2022年8月6日
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
专知会员服务
13+阅读 · 2022年8月1日
Cell专刊|AI在蛋白结构、精准医疗、抗体疗法[综述]等的应用与未来预测
专知会员服务
16+阅读 · 2022年7月24日
Nat Rev Mol Cell Bio|用人工智能预测蛋白质结构的前景和机遇
专知会员服务
17+阅读 · 2022年5月1日
【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术,State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold
专知会员服务
20+阅读 · 2022年3月14日
【AI4Science】利用人工智能加速科学发现- DeepMind-CEO Demis Hassabis最新演讲视频报告
专知会员服务
28+阅读 · 2022年3月7日
【Nature子刊】ProteinGAN使用生成式对抗网络生成蛋白质变体,加速药物研发
专知会员服务
25+阅读 · 2021年4月6日
热门VIP内容
开通专知VIP会员 享更多权益服务
《面向空战战术、技术和程序测试与评估的实时-虚拟-建构模拟框架:第2部分-实施》28页
《面向空战战术、技术和程序测试与评估的实时-虚拟-建构模拟框架》15页slides
美空军下一代空中优势(NGAD)战机:最新情况
《面向空战战术、技术和程序测试与评估的实时-虚拟-建构模拟框架:第1部分-评估框架》19页
相关资讯
比AlphaFold2快10倍!国产开源项目加速蛋白质预测,超长序列22分钟就搞定
量子位
0+阅读 · 2022年8月23日
地球超2亿蛋白质结构全预测,AlphaFold引爆「蛋白质全宇宙」!
极市平台
0+阅读 · 2022年7月29日
世间几乎所有已知蛋白质结构,都被DeepMind开源了
机器之心
0+阅读 · 2022年7月29日
无缝支持Hugging Face社区,Colossal-AI低成本轻松加速大模型
机器之心
2+阅读 · 2022年7月13日
让所有人都能做蛋白质结构预测,华为昇思 MindSpore 最新成果将开源
机器之心
0+阅读 · 2022年7月8日
后AlphaFold时代,AI如何持续赋能蛋白质计算?
中国科学院自动化研究所
0+阅读 · 2022年6月6日
推理加速GPT-3超越英伟达方案50%!最新大模型推理系统Energon-AI开源,来自Colossal-AI团队
量子位
0+阅读 · 2022年5月31日
快80~500倍!人工智能快速预测两种蛋白质的结构互作方式
机器之心
1+阅读 · 2022年2月19日
相关基金
基于异构网络的致病基因及其复合物预测方法研究
国家自然科学基金
0+阅读 · 2015年12月31日
G蛋白偶联受体结构及与药物配体结合的计算研究
国家自然科学基金
0+阅读 · 2015年12月31日
基于结构域的蛋白质-RNA相互作用预测模型构建
国家自然科学基金
0+阅读 · 2014年12月31日
基于多尺度系统生物学的药物-副作用相互作用网络预测研究
国家自然科学基金
0+阅读 · 2013年12月31日
自相互作用蛋白质的系统研究和预测
国家自然科学基金
2+阅读 · 2012年12月31日
真核转录延伸复合物因子的结构生物学研究
国家自然科学基金
0+阅读 · 2011年12月31日
应用机器学习方法预测和分析蛋白质的结构柔性
国家自然科学基金
4+阅读 · 2010年12月31日
de novo预测蛋白质结构的并行元启发方法研究
国家自然科学基金
0+阅读 · 2009年12月31日
真核基因转录后调控过程相关蛋白质及其复合物的结构生物学研究
国家自然科学基金
0+阅读 · 2009年12月31日
病原细菌鞭毛蛋白质复合物三维结构和功能关系的研究
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Generating 2D and 3D Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution
Arxiv
0+阅读 · 2022年11月28日
Cross-Domain Ensemble Distillation for Domain Generalization
Arxiv
1+阅读 · 2022年11月25日
Question Answering and Question Generation for Finnish
Arxiv
0+阅读 · 2022年11月24日
Semantic Communication Enabling Robust Edge Intelligence for Time-Critical IoT Applications
Arxiv
0+阅读 · 2022年11月24日
Backdoor Attack and Defense in Federated Generative Adversarial Network-based Medical Image Synthesis
Arxiv
0+阅读 · 2022年11月24日
CSCD-IME: Correcting Spelling Errors Generated by Pinyin IME
Arxiv
0+阅读 · 2022年11月24日
COCO-DR: Combating Distribution Shifts in Zero-Shot Dense Retrieval with Contrastive and Distributionally Robust Learning
Arxiv
0+阅读 · 2022年11月24日
Complexity Framework For Forbidden Subgraphs
Arxiv
0+阅读 · 2022年11月23日
Data Augmentation for Graph Neural Networks
Arxiv
38+阅读 · 2020年12月2日
Conditional Random Field and Deep Feature Learning for Hyperspectral Image Segmentation
Arxiv
11+阅读 · 2017年12月27日
大家都在搜
palantir
洛克菲勒
强化学习方法
自主系统
自主武器
RE-NET
汽车智能化
大模型
无人艇
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top