Self-driving laboratories (SDLs) are combining recent technological advances in robotics, automation, and machine learning based data analysis and decision-making to perform autonomous experimentation toward human-directed goals without requiring any direct human intervention. SDLs are successfully used in materials science, chemistry, and beyond, to optimise processes, materials, and devices in a systematic and data-efficient way. At present, the most widely used algorithm to identify the most informative next experiment is Bayesian optimisation. While relatively simple to apply to a wide range of optimisation problems, standard Bayesian optimisation relies on a fixed experimental workflow with a clear set of optimisation parameters and one or more measurable objective functions. This excludes the possibility of making on-the-fly decisions about changes in the planned sequence of operations and including intermediate measurements in the decision-making process. Therefore, many real-world experiments need to be adapted and simplified to be converted to the common setting in self-driving labs. In this paper, we introduce an extension to Bayesian optimisation that allows flexible sampling of multi-stage workflows and makes optimal decisions based on intermediate observables, which we call proxy measurements. We systematically compare the advantage of taking into account proxy measurements over conventional Bayesian optimisation, in which only the final measurement is observed. We find that over a wide range of scenarios, proxy measurements yield a substantial improvement, both in the time to find good solutions and in the overall optimality of found solutions. This not only paves the way to use more complex and thus more realistic experimental workflows in autonomous labs but also to smoothly combine simulations and experiments in the next generation of SDLs.


翻译:自动驾驶实验室(SDLs)通过整合机器人技术、自动化以及基于机器学习的数据分析与决策等最新技术进步,实现了在无需人工直接干预的情况下,围绕人类设定目标进行自主实验。目前,SDLs已成功应用于材料科学、化学及其他领域,以系统化且数据高效的方式优化工艺、材料与器件。在确定最具信息量的下一实验方案时,应用最广泛的算法是贝叶斯优化。尽管标准贝叶斯优化能相对简便地适用于各类优化问题,但其依赖于固定的实验流程,即明确的优化参数集及一个或多个可测量的目标函数。这排除了在计划操作序列中实时调整决策的可能性,也无法将中间测量结果纳入决策过程。因此,许多现实世界的实验需经过适配与简化,才能转化为自动驾驶实验室中的通用设置。本文提出一种贝叶斯优化的扩展方法,支持对多阶段工作流进行灵活采样,并基于中间观测变量(我们称之为代理测量)做出最优决策。我们系统比较了考虑代理测量相较于仅观测最终测量结果的传统贝叶斯优化的优势。研究发现,在广泛的应用场景中,代理测量能显著提升性能,既缩短了寻找优质解决方案的时间,也提高了所获解决方案的整体最优性。这不仅为在自主实验室中应用更复杂、更贴近实际的实验流程铺平了道路,也为下一代SDLs中仿真与实验的无缝融合奠定了基础。

0
下载
关闭预览

相关内容

AI4Research:科学研究中的人工智能综述
专知会员服务
33+阅读 · 7月4日
信息物理融合系统 (CPS)研究综述
专知会员服务
47+阅读 · 2022年3月14日
3倍加速CPU上的BERT模型部署
ApacheMXNet
11+阅读 · 2020年7月13日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
VIP会员
相关资讯
3倍加速CPU上的BERT模型部署
ApacheMXNet
11+阅读 · 2020年7月13日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员