一个模型搞定元素周期表常见元素：中国团队打造分子模拟预训练模型，最高节省90%数据

会员服务 ·

一个模型搞定元素周期表常见元素：中国团队打造分子模拟预训练模型，最高节省90%数据

2022 年 8 月 27 日 量子位

白交发自凹非寺
量子位 | 公众号 QbitAI

分子模拟领域的预训练模型，来了！

DPA-1，中国团队深势科技以及北京科学智能研究院等机构打造，能覆盖元素周期表大多数常见元素。

在各类数据集上的迁移学习结果表明，该模型能大幅降低新场景对数据的依赖，甚至在特定条件下能省去90%的数据。

用大模型的思路打开分子模拟

机器学习辅助下的原子间势能面（PES）建模，与相应的机器学习势函数正在彻底改变分子模拟领域。PES是用于描述化学体系的一个基本量，通过它能得到大量原子间相互作用的信息。

过去传统的分子模拟，主要是基于物理经验得到的解析函数来描述PES，但始终无法完整描述出原子间相互作用。

目前，机器学习势函数得益于第一性原理计算产生的数据，极大拓展了模型的应用范围，在材料科学、计算物理等领域应用广泛，并取得了较大成果。

不过仍面临着现有模型迁移能力不足、缺乏通用大模型的局限性。当面对一个复杂体系时，仍需获取大量数据从头开始训练模型，造成计算成本高昂。

基于这样的背景，研究人员参考当下在CV、NLP等领域中大模型的一种“预训练+少量数据微调”解决方案，提出了DPA-1，基于新注意力机制的深度势能预训练模型。

类似于NLP的注意力机制，研究人员提出了门控注意力机制 （即图中的红色模块）。

据介绍，该模型在原子局部环境矩阵上进行了类比多体（大量粒子构成的微观系统）相互作用的信息交互，并以正则化的相对坐标点乘作为角度信息，对获得注意力权重进行重新加权，以此来实现类似门控的机制。

此外，DPA-1还引入了对元素的编码。不同元素共用同一套网络参数，从而提升元素容量。

还将化学元素可视化

在迁移性测试中，研究人员有意将不同训练集划分成多个子集，且每个子集的组分、构型都有较大差异。

以AlMgCu合金数据集为例，则是分为了single、binary、ternary三个子集。

（single子集仅包含单质/一元数据，binary仅有二元数据，即Al-Mg，Al-Cu，Mg-Cu；而ternary则是剩余的三元数据）

结果显示，相较于DeepPot-SE，DPA-1的测试精度有较大的提升，甚至在特定条件下这种提升达到了一两个数量级。

进一步地，研究人员设计了迁移学习的方案。

简言之，就是先在较大规模数据上进行预训练，然后根据新的少量数据集修改最后一层能量偏差。

在AlMgCu合金数据集测试中，就将一元、二元子集上进行预训练，然后在三元子集上测试。

结果显示，对比DeepPot-SE，DPA-1可节省约90%的三元数据。

在仅有少量三元数据测试下，也能达到较高的精度。

接着他们在包含56种元素的大型数据集OC2M上预训练，并将其迁移到毫不相关的HEA和AlCu数据集上，结果都显示出能成功的应用。

其他类似模型GemNet（分子的通用方向图神经网络）在同样OC2M数据集上预训练，产生的模型有数十亿的参数，训练时间需要数以千计的GPU hours。

而DPA-1只需要不到200个GPU hours 来训练不到一百万个参数，并取得了不错的结果（DPA-1和Gemnet-OC[34]的能量MAE为0.681 vs 0.286 eV）。

除此之外，他们还将元素可视化——模型中学习到元素编码进行了PCA降维并可视化。

可以看到，所有元素都呈螺旋状分布，同周期元素沿着螺旋下降，同族元素则垂直螺旋方，恰好对应的是元素周期表的位置。

据研究人员介绍，本次研究证明了“预训练+少量任务微调”流程的可行性。

接下来，他们将致力于势函数自动化生产、自动化测试，也将关注像多任务训练、无监督学习、模型压缩、蒸馏等操作，方便用户一键生成下游任务所需的势能函数。

感兴趣的旁友，可戳下方论文链接了解更多~

论文链接：
https://arxiv.org/abs/2208.08236
GitHub链接：
https://github.com/deepmodeling/deepmd-kit
参考链接：
https://mp.weixin.qq.com/s/cbTgntJmuntskQmTWjAINA

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位哦 ~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

分子

关注 0

基于几何结构预训练的蛋白质表征学习

专知会员服务

15+阅读 · 2022年8月21日

ATMOL：利用对比学习预训练模型预测分子性质

专知会员服务

12+阅读 · 2022年8月14日

AI算法 | 基于原子环境的神经机器翻译用于逆合成预测

专知会员服务

4+阅读 · 2022年6月30日

DeepMind | 通过去噪来进行分子性质预测的预训练

专知会员服务

13+阅读 · 2022年6月27日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

ICLR 2022｜化学反应感知的分子表示学习

专知会员服务

21+阅读 · 2022年2月10日

【AAAI2022】利用化学元素知识图谱进行分子对比学习

专知会员服务

28+阅读 · 2021年12月3日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

文澜：超大规模多模态预训练模型！

专知会员服务

66+阅读 · 2021年3月21日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

14+阅读 · 2020年9月20日

李飞飞团队新作MaskViT：用于视频预测的掩码视觉预训练

极市平台

0+阅读 · 2022年6月27日

药物设计领域的BERT？三维分子表征学习框架Uni-Mol，一个模型刷爆所有下游任务

PaperWeekly

0+阅读 · 2022年5月27日

【DeepMind】通用模型Gato(只一个模型神经网络,使用相同的权重, 达到SOTA水平)。

深度强化学习实验室

2+阅读 · 2022年5月15日

许锦波团队开发蛋白逆折叠深度学习框架，用更少结构数据训练获得更准确序列预测

机器之心

0+阅读 · 2022年4月24日

训练CV模型新思路来了：用NLP大火的Prompt替代微调，性能全面提升

量子位

2+阅读 · 2022年3月25日

90.35%准确率！谷歌刚刚开源最大视觉模型V-MoE的全部代码！150亿参数！

CVer

0+阅读 · 2022年1月21日

150亿参数，谷歌开源了史上最大视觉模型V-MoE的全部代码

机器之心

0+阅读 · 2022年1月14日

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

机器之心

0+阅读 · 2021年12月12日

成本砍砍砍！不用数据也能用 BERT 做对比学习？

夕小瑶的卖萌屋

0+阅读 · 2021年7月20日

地幔碳酸盐熔体电导率的分子模拟与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于GPUs的三原子碰撞量子态态动力学非绝热效应研究

国家自然科学基金

0+阅读 · 2015年12月31日

含氟钛硅分子筛的结构特征及其催化性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

重离子诱导的水分子与氙原子之间能量传递过程的实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

二元纳米共晶相图的尺寸效应

国家自然科学基金

0+阅读 · 2013年12月31日

支持多种计算与数据共享的编程框架研究

国家自然科学基金

0+阅读 · 2013年12月31日

线性纠缠高分子的弛豫过程的研究

国家自然科学基金

0+阅读 · 2013年12月31日

含有缺失值的纵向数据回归模型的稳健推断

国家自然科学基金

3+阅读 · 2012年12月31日

采用数值流形法对CO2地质封存多场耦合的数值模拟

国家自然科学基金

0+阅读 · 2011年12月31日

超冷温度下分子反应碰撞势能函数

国家自然科学基金

0+阅读 · 2011年12月31日

A Data-driven Latent Semantic Analysis for Automatic Text Summarization using LDA Topic Modelling

Arxiv

0+阅读 · 2022年11月28日

Federated Learning Hyper-Parameter Tuning from a System Perspective

Arxiv

0+阅读 · 2022年11月24日

Data-Driven Network Neuroscience: On Data Collection and Benchmark

Arxiv

0+阅读 · 2022年11月23日

Data Augmentation Vision Transformer for Fine-grained Image Classification

Arxiv

0+阅读 · 2022年11月23日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Graph Neural Networks for Natural Language Processing: A Survey

Arxiv

36+阅读 · 2021年6月10日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph

Arxiv

11+阅读 · 2020年7月31日

Bilinear Attention Networks

Arxiv

11+阅读 · 2018年5月21日

Additive Margin Softmax for Face Verification

Arxiv

11+阅读 · 2018年1月18日

VIP会员