We propose a novel method enabling autocompletion of chemical flowsheets. This idea is inspired by the autocompletion of text. We represent flowsheets as strings using the text-based SFILES 2.0 notation and learn the grammatical structure of the SFILES 2.0 language and common patterns in flowsheets using a transformer-based language model. We pre-train our model on synthetically generated flowsheets to learn the flowsheet language grammar. Then, we fine-tune our model in a transfer learning step on real flowsheet topologies. Finally, we use the trained model for causal language modeling to autocomplete flowsheets. Eventually, the proposed method can provide chemical engineers with recommendations during interactive flowsheet synthesis. The results demonstrate a high potential of this approach for future AI-assisted process synthesis.
翻译:我们提出一种能够自动完成化学流程表的新颖方法。 这个想法受到文本自动完成的启发。 我们用基于文本的 SFILES 2. 0 符号作为流程表的字符串。 我们用基于文本的 SFILES 2.0 符号表示流程表, 并学习SFILES 2. 0 语言的语法结构以及使用基于变压器的语言模型的流程表的通用模式。 我们在合成生成的流程表模型上进行预培训, 以学习流程表语言的语法。 然后, 我们微调我们的模型, 在实际流程表表表表表表上转换学习步骤。 最后, 我们使用经过培训的因果语言模型来模拟自动完整的流程表。 最后, 拟议的方法可以在互动式流程表合成过程中为化学工程师提供建议。 结果表明, 这种方法对于未来的 AI- 辅助进程合成具有很高的潜力。