Molecular crystal structure prediction (CSP) seeks the most stable periodic structure given the chemical composition of a molecule and pressure-temperature conditions. Modern CSP solvers use global optimization methods to search for structures with minimal free energy within a complex energy landscape induced by intermolecular potentials. A major caveat of these methods is that initial configurations are random, making thus the search susceptible to convergence at local minima. Providing initial configurations that are densely packed with respect to the geometric representation of a molecule can significantly accelerate CSP. Motivated by these observations, we define a class of periodic packings restricted to crystallographic symmetry groups (CSG) and design a search method for the densest CSG packings in an information-geometric framework. Since the CSG induce a toroidal topology on the configuration space, a non-Euclidean trust region method is performed on a statistical manifold consisting of probability distributions defined on an $n$-dimensional flat unit torus by extending the multivariate von Mises distribution. Introducing an adaptive quantile reformulation of the fitness function into the optimization schedule provides the algorithm with a geometric characterization through local dual geodesic flows. Moreover, we examine the geometry of the adaptive selection-quantile defined trust region and show that the algorithm performs a maximization of stochastic dependence among elements of the extended multivariate von Mises distributed random vector. We experimentally evaluate the behavior and performance of the method on various densest packings of convex polygons in $2$-dimensional CSGs for which optimal solutions are known, and demonstrate its application in the pentacene thin-film CSP.
翻译:分子晶体结构预测( CSP) 寻求最稳定的周期性结构 。 鉴于分子和压力温度条件的化学构成, 现代 CSP 解析器使用全球优化方法, 在一个由分子间潜在诱导的复杂能源环境中寻找最无能量的结构。 这些方法的主要告诫是, 初始配置是随机的, 从而使得搜索在本地微型中易于趋同。 提供与分子的几何表达面相密的初始配置可以大大加速 CSP 。 基于这些观察, 我们定义了限于晶体对称组( CSG ) 的定期包装类别, 并设计了一种在信息地理测量框架内寻找最稠密的 CSG 包装的搜索方法。 由于CSG 在配置空间上诱导出一个至甲状腺表的表面结构, 一种非欧元信任区域的方法是, 由以美元米氏度平方单位为单位的概率分布构成的概率分布, 通过扩大多变量分布, 我们将一个适应性重的基调重的基体重新组合, 在优化的测算表上,, 我们通过精确的精确测算法的C,,,, 分析 的 分析 分析 的, 的 分析 的 的,, 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的