国产AI制药新突破!深势科技发布一站式药研计算设计平台Hermite

2022 年 11 月 4 日 量子位
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

年度最受关注赛道——AI制药,传来最新进展:

深势科技的新一代药物计算设计平台Hermite正式发布,并且迅速引发圈内热议和关注。

传统上,研发一款新药平均需要耗费10-15年时间、花费26亿美元,其中包括大量失败尝试的支出。

而AI for Science的新范式正是被寄予了提高研发成功率,从而加速研发周期、减少成本、最终提高新药研发投资回报率的厚望。

此轮AI制药热潮始于预测蛋白质结构的AlphaFold系列,但这只是新药研发的第一步。

后续还需要结构精修,到苗头化合物筛选,再到先导化合物优化和性质预测等等。

这众多环节,也都急需相应的新工具,新算法和不断进步的认知。

在科研工具方面,深势科技团队于去年推出Uni-Fold,全尺寸复现AlphaFold 2,并开源了训练代码与推理代码,为国际上首家。

如今近一年过去,不但Uni-Fold在功能和速度上迎来诸多改进,还有更多后续核心功能集中发布。

这些功能整合在Hermite平台上,致力于为药物研发工作者提供在CADD(计算机辅助药物设计)中数据、算法、算力三位一体的一站式解决方案。

药物研发一站式解决方案Hermite

Hermite平台的四大核心功能,对应着小分子药物设计领域的各项流程。

首先,蛋白质结构预测与优化工具Uni-Fold是一个起点。

Uni-Fold做到精度与AlphaFold 2接近,但效率比AlphaFold 2 显著提升,并克服了AlphaFold 2未开源训练代码、硬件支持单一、模型不可商用等局限性,

最近的升级中,Uni-Fold还在超大规模蛋白复合物预测上取得新突破,对包括离子通道、新冠病毒刺突糖蛋白等在内的对称蛋白的进一步研究具有重大意义。

预测出靶点蛋白质的结构就可以进入苗头化合物筛选环节,对应的是超高通量虚拟筛选工具Uni-Docking。

Uni-Docking在保持筛选精度的前提下,在GPU上实现了比单核CPU 1600倍的加速,最快0.5小时可完成1200万可采买分子数据库的筛选。

与MM GB/PBSA组成虚拟筛选工作流后,准确性还能进一步得到提升,将千万级分子数据库的虚拟筛选推入可及、可用、可靠的时代。

有了靶点和苗头化合物,接下来还需要预测药靶结合模式,对应工具为Uni-IFD。

通过模拟药物分子与靶点结合产生的“诱导契合”效应,Uni-IFD可以精确预测药物与靶点的结合模式。

同时,Uni-Aquasite可以通过计算得到每个水分子的自由能,寻找对药靶结合影响较大的水分子。

最后,则是基于自由能微扰的先导化合物优化工具Uni-FEP。

Uni-FEP 基于自由能微扰理论、分子动力学、增强采样算法,以化学精度高效评估蛋白质与配体的结合亲和能。克服了传统分子对接方法打分函数不准、采样不足的问题。

适用于R基团优化、骨架跃迁、电荷转移、大环成环等多种不同的优化场景,以实现工业规模的先导化合物优化。

介绍完了核心功能,Hermite平台还有一个值得关注的地方是使用方式。

与传统科学计算客户端软件不同,Hermite是免安装、浏览器登录即用的SaaS服务,体验上包括可视化、结构化分子,最大化操作区域,灵活调整窗口,跨窗口智能化协作等特点,这大大提升了应用体验。

这样一来,既能避免复杂的安装流程、升级维护成本,更能以星期为单位不断升级,持续将最新科研进展带到药物研发工作者手中。

基于云原生架构,Hermite整合数据、算法与算力,具备大规模分布式计算能力,提高计算速度,同时也支持线下私有化部署。

据介绍,Hermite平台已被国内外数十家创新药企和上千位学术用户广泛应用。

同时基于平台能力,深势科技与业内多家合作伙伴建立了十余条合作管线,覆盖包括CNS、肿瘤和自身免疫性疾病等领域,目前部分管线已处于Pre-PCC阶段。

在发布会现场,恒瑞医药、益方生物、丽珠医药集团、泓博医药等合作伙伴的研究员也分享了AI for Science新范式下科研的经验与心得。

Hermite背后的深势科技

实际上,在推出Hermite之前,成为AI for Science创业代表的深势科技就已颇受业内关注:

深势科技创立于2018年,曾在18个月内连续完成4轮融资,最近一轮融资额达数千万美元。

从团队背景看,创始人兼首席科学家张林峰,北京大学元培学院出身,在普林斯顿大学获应用数学系博士学位。

另一位创始人兼CEO孙伟杰同样来自北大元培,本科毕业后继续在北京大学深造并获硕士学位。

孙伟杰曾作为天使投资人活跃在科技、教育、企业服务等领域,张林峰则偏重前沿科学研究和技术应用探索。

此外,中科院院士、北京科学智能研究院院长、北京大学教授鄂维南担任了深势科技的首席科学顾问。

技术实力上,由鄂维南院士领衔的数十人科研队伍,包含物理建模、数值算法、机器学习、高性能计算及药物和材料计算等多个领域的专业人才。

他们均来自世界一流名校、顶尖科研院所和行业领军企业,其中许多人拥有多学科交叉背景、丰富的科研和应用经验。

有着这样一支实力强大的研发队伍,深势科技致力于“以新一代分子模拟方法打造微尺度工业设计平台”的愿景,正在逐步清晰和实现。

新一代分子模拟方法,指「多尺度建模+机器学习+高性能计算」新研究范式。

深势科技核心成员参与的一项研究,用机器学习方法将分子动力学极限提升至10亿原子规模同时保持高精度。

这项成果在2020年获得有「超算届诺贝尔奖」之称的戈登·贝尔奖,还与「量子优越性」和「人造太阳」等成果一起当选2020中国十大科技进展。

再次聚焦到这次发布,Hermite正是这种新研究范式落地的标志性事件。

在发布会现场,中科院院士,北京科学智能研究院院长,深势科技首席科学顾问鄂维南表示:

Hermite是AI for Science从算法创新到应用落地的里程碑实践和代表产品。

鄂维南指出,AI for Science研究范式不仅拓展了数据驱动、物理模型驱动模式的能力边界,还以产品的形式推动二者有机结合,供产业界的朋友共同使用。

值得注意的是,深势科技创始人兼CEO基于深势近年来在AI4S领域的研究和深耕,提出了“科学实验算法分级理论”,即如何对算法设定合理的期望,怎样的算法是可以大规模替代实验的工业级算法。

孙伟杰将科学实验算法分为L1至L3三个级别:

  • L1为模仿现实,即对实验结果的复制和外推;

  • L2为预测现实,对现象的预测接近实验精度,并有可预期的误差范围;

  • L3为搜索现实,这就要求能够准确预测现象,并能从空间中直接搜索最佳结果。

当前,对于化学、生物、材料、药物等实验学科,并不一定追求百分之百准确的算法。

只要能够大幅缩小实验误差,明确精度边界,就可以大规模的替代此前的实验模式。

所以大规模推广L2级别,积极发展L3级别的科学实验算法,将引领未来实验科学算法的前进方向。

对于未来发展方向,深势科技表示:

从现在到2025年的核心目标,是在药物研发的各个环节打造一系列能够规模化替代实验的工业级算法,把以经验驱动的实验试错模式转变为“计算设计-实验验证”的理性迭代模式。

而Hermite充分利用云计算时代软件功能特点和优势,在基础设施快速建设和发展的时代,能够帮助用户持续触达最前沿的药物设计算法,并以星期为单位不断升级产品使用体验,做到持续进化。

最近一年来,我们能看到AI for Science突破性成果频频登上Nature、Science等顶刊,生物上从蛋白质结构预测到蛋白质分子设计,数学上有AI辅助科学家证明定理,物理上有AI找出质子中存在新夸克的证据。

但像Hermite这样的产业落地成果却并不多见。

要把算法打造成工业级,就不仅是AI公司自己的事,还需要系统工程和相关行业经验以及整个行业,产业链的携手并进。

深势科技为此发展了DeepModeling开源社区,将科研成果开放共享,颇受业界欢迎。曾出现过自己的论文刚发不久,就有多篇使用该方法做出的成果接连发表。

在深势科技“成就伙伴,引领创新”的理念下,算法开发方、行业应用方、云计算服务方等多方合作打磨才有了Hermite平台的诞生。Hermite和深势科技还将把这种模式坚持下去,为行业做好赋能。

由此可以看出,在这个时代,闭门造车并不是最好的选择。与行业合作伙伴共建,才是将学术研究落地到产业实践,实现“科学技术是第一生产力”的最佳路线。

点击下方视频,了解更多详情。

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


登录查看更多
0

相关内容

几何图神经网络在百度生物计算平台的应用
专知会员服务
20+阅读 · 2022年10月28日
高精度从头设计透膜环肽分子
专知会员服务
3+阅读 · 2022年9月6日
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
11+阅读 · 2022年8月28日
2022年中国AI制药行业概览,39页pdf
专知会员服务
42+阅读 · 2022年7月28日
ICLR | 训练面向分子模拟的十亿级参数 GNN
专知会员服务
8+阅读 · 2022年6月27日
图表示学习在药物发现中的应用,48页ppt
专知会员服务
99+阅读 · 2021年4月30日
Science:深度学习建模,AI巧手设计特定蛋白质
后AlphaFold时代,AI如何持续赋能蛋白质计算?
中国科学院自动化研究所
0+阅读 · 2022年6月6日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2023年1月4日
Multi-Domain Multi-Task Rehearsal for Lifelong Learning
Arxiv
12+阅读 · 2020年12月14日
Arxiv
14+阅读 · 2020年9月1日
VIP会员
相关VIP内容
几何图神经网络在百度生物计算平台的应用
专知会员服务
20+阅读 · 2022年10月28日
高精度从头设计透膜环肽分子
专知会员服务
3+阅读 · 2022年9月6日
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
11+阅读 · 2022年8月28日
2022年中国AI制药行业概览,39页pdf
专知会员服务
42+阅读 · 2022年7月28日
ICLR | 训练面向分子模拟的十亿级参数 GNN
专知会员服务
8+阅读 · 2022年6月27日
图表示学习在药物发现中的应用,48页ppt
专知会员服务
99+阅读 · 2021年4月30日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员