新物质?新材料?探索元素周期表,机器学习帮你找!

2019 年 9 月 22 日 量子位
铁头娃 发自 凹非寺
量子位 出品 | 公众号 QbitAI

你知道今年是元素周期表诞生150周年吗?

1869年,俄国化学家门捷列夫将当时已知的63种元素写在卡片上,根据化学和物理性质进行排列,形成了元素周期表的雏形。

目前常用的元素周期表是短式表,还有长式表,特长表,平面螺线表,圆形表,甚至还有立体周期表。

现在,科学家们利用机器学习,重新挖掘元素间的关系,探索元素周期表的新形式以及材料的新可能。

元素周期表,进化!

洛桑联邦理工大学的研究人员,就使用机器学习的方式,探索了元素周期表在高维表达的可能形式。

这些新的元素关系人类无法眼见为实,所以利用机器学习可以探索更多可能。

他们根据密度泛函理论导入了近11000种四元素化合物(形式为ABCx2Dx6)的结构作为数据集。

这些化合物的结构通过原子间的位置排布和化学性质,可以被划定为不同的特征向量。

除此之外,这些化合物包括39种主族元素,包括了很大一部分常见的化合物形式。

他们通过对确定低维度的特征值来对高维度的特征向量进行简化,就像数学中为了分析曲线性质来确定坐标系一样。

他们发现,一些特定元素在低维度会聚集在一起,

那么这个聚集现象是不是与元素在周期表中的位置相关呢?

研究者将这些元素的关系进行可视化处理后,发现这些元素的关系和之前人们推导的关系很接近:

惰性气体不跟主流元素一起玩,而且个个都是独行侠;

卤族元素是一家,代表颜色尽可能一致,碱金属有样学样也一起抱团;

同族元素中,最短周期元素和其他周期元素泾渭分明,氢元素作为元素周期表的老大,跟其他同组元素比显得更为突出。

从低维度向高维度的反推过程,也表现出类似的结果。

但是在特定的数据集内容限制下,元素之间的关系发生了偏移。

在钙钛矿中,第一主族元素依旧像以前一样扎堆,

但是氢元素在算法中表现的的性质开始偏向于氢化物,

这样的氢元素更容易脱离,并与卤族元素和硫族元素结合。

△ 图为微观钙钛矿

如果将原有平面三维化,那么氢元素和其他碱性金属同之前二维平面的结果相比,距离会变得更近。

这些结果不但契合了元素的基本分组理论和性质,并且元素的独特性质在三维平面中的表现。

也说明了根据元素的性质,元素周期表不只是二维的

论文摘要去淘金!

加州劳伦斯-伯克利国家实验室的研究人员,则选择把材料领域作为机器学习的突破口,这个选择更为大胆。

他们尝试做一个巨量的材料结构和性质数据库,通过已知的材料性质与结构的关系,

来对可能出现的材料结构“淘金”,希望能够预测出新材料。

没有现成的理论,没有直观可行的数据,这条探索之路可以说伸手不见五指。

但是,


材料领域论文多啊!

于是他们利用了论文中出现的词汇作为他们的材料科学数据集,

分析文本的算法是现成的,并且在历史和文学方面也有应用。

所以他们录入了从1922年到2018年的330万篇摘要,扫描了五十万词汇,其中包括化学公式。

而机器学习的分析结果也是非常有趣的,例如镍化铁就与铁磁性挂钩,而铋化碲则与热电性质相关,这跟现实科学研究得出来的结论相符。


按照这个思路,就可以对根据之前机械学习的经验,对新材料的性质和应用进行分析。

甚至可以在新材料被发现之前,预测相关的研究方向。

机器学习,经验回归

为什么只是用机器学习对化学周期表和材料论文淘金,就值得如此重视呢?

因为这代表着化学的经验化研究方式,可以擦净历史的尘埃,重现光彩。

化学,在瓶瓶罐罐分析实验的背后,是一门经验化的科学,

这个学科所有的理论和经验,都是依靠不断的实验,统计和推翻,以及继续实验的循环不断确定的过程。

△ 图为拉瓦锡实验铜像

这个学科不能依靠宏观的理论推导,完美实现化学反应的预演。

另一方面,对新材料的探索和应用研究,还是无法避免依靠实验的经验总结过程。

人的总结能力终归是有限的,而机器学习则极大的拓展了研究者范例总结的边界。

化学的萌芽阶段,就是靠从粗浅的现象到深入的性质,进行逐步的经验总结。

而机器学习,即将把化学最开始的探索手段,实现出新的价值。

原文链接
https://www.chemistryworld.com/opinion/machine-learning-mendeleevs-have-rediscovered-the-periodic-table/3010720.article

作者系网易新闻·网易号“各有态度”签约作者


榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选 启幕,领航企业、商业突破人物、最具创新力产品3大奖项,欢迎优秀的AI公司报名参与!

AI社群 | 与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 ! 

登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
169+阅读 · 2020年3月10日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
354+阅读 · 2020年2月15日
机器学习在材料科学中的应用综述,21页pdf
专知会员服务
48+阅读 · 2019年9月24日
元素周期表都见过,但这顿操作也太硬核了吧!
材料科学与工程
3+阅读 · 2019年5月19日
特征方程的物理意义
算法与数学之美
6+阅读 · 2019年5月13日
【材料课堂】TEM复杂电子衍射花样的标定原理
材料科学与工程
39+阅读 · 2019年4月12日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
图解机器学习的常见算法
机器学习算法与Python学习
5+阅读 · 2018年4月2日
入门 | 这是一份文科生都能看懂的线性代数简介
机器之心
13+阅读 · 2018年3月31日
如何轻松解锁神经网络的数学姿势
ImportNew
6+阅读 · 2018年1月4日
图解机器学习
深度学习世界
3+阅读 · 2017年11月24日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
Graph Analysis and Graph Pooling in the Spatial Domain
Learning by Abstraction: The Neural State Machine
Arxiv
6+阅读 · 2019年7月11日
Arxiv
4+阅读 · 2019年4月3日
Learning Blind Video Temporal Consistency
Arxiv
3+阅读 · 2018年8月1日
Arxiv
3+阅读 · 2018年4月3日
VIP会员
相关资讯
元素周期表都见过,但这顿操作也太硬核了吧!
材料科学与工程
3+阅读 · 2019年5月19日
特征方程的物理意义
算法与数学之美
6+阅读 · 2019年5月13日
【材料课堂】TEM复杂电子衍射花样的标定原理
材料科学与工程
39+阅读 · 2019年4月12日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
图解机器学习的常见算法
机器学习算法与Python学习
5+阅读 · 2018年4月2日
入门 | 这是一份文科生都能看懂的线性代数简介
机器之心
13+阅读 · 2018年3月31日
如何轻松解锁神经网络的数学姿势
ImportNew
6+阅读 · 2018年1月4日
图解机器学习
深度学习世界
3+阅读 · 2017年11月24日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
Top
微信扫码咨询专知VIP会员