Benchmark suites provide useful measurements of an evolutionary algorithm's problem-solving capacity, but the constituent problems are often too complex to cleanly identify an algorithm's strengths and weaknesses. Here, we introduce the benchmark suite DOSSIER (``Diagnostic Overview of Selection Schemes In Evolutionary Runs'') for empirically analyzing selection schemes on important aspects of exploitation and exploration. Exploitation is fundamentally hill climbing, but we consider two scenarios: pure exploitation where each position in the representation can be optimized independently, and constrained exploitation where upward progress is more limited due to interactions between positions. Exploration is necessary when the optimization path is less clear; we consider the ability to follow multiple independent hill climbing pathways and the ability to cross fitness valleys. Each combination of these scenarios produces distinct fitness landscapes that help characterize the evolutionary dynamics associated with a given selection scheme. We analyze six popular selection schemes. Tournament selection and truncation selection both excelled at with exploitation metrics, but performed poorly when exploration was required; conversely, novelty search excelled at exploration but failed to exploit gradients. Fitness sharing performed well when overcoming deception, but poorly across all other diagnostics. Nondominated sorting was best for maintaining diverse populations comprised of individuals inhabiting multiple optima, but struggled to effectively exploit gradients. Lexicase selection balanced search space exploration without sacrificing exploitation, generally performing well across diagnostics. Our work demonstrates the value of diagnostics for quickly building an intuitive understanding of selection scheme characteristics, which can then be used to improve or develop new selection methods.
翻译:基准套件为进化算法解决问题的能力提供了有用的衡量方法。 但组成问题往往过于复杂,无法明确算法的优缺点。 在这里, 我们推出基准套件 DOSSIER (“ 进化运行中选择计划诊断性概述 ” ), 用于对开发与勘探重要方面的选择计划进行经验分析。 开发基本上是攀升, 但我们考虑两种情景: 纯粹开发, 代表方的每个职位都可以独立优化, 以及有限的开发, 但由于各位置之间的相互作用, 上调进展更受限制。 当优化路径不那么清晰时, 有必要进行探索; 我们考虑是否有能力遵循多个独立的山坡攀爬路径, 以及跨越健身河谷的能力。 每种情景组合都产生了不同的健康环境, 有助于与特定选择计划相关的进化动态特征。 我们分析了六种流行的甄选计划。 选标注和调选择都优于开发标准, 但是在需要勘探时表现得差; 反正, 探索时的新搜索搜索优, 却无法利用梯度。 在克服欺骗时, 共享共享共享 克服骗术, 但在所有其它的诊断性选择中, 选择中, 展示性选择方法 进行 进行 分析性选择 分析性 分析性 分析 分析 进行 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 方法 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 方法 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析 分析