The study of robustness has received much attention due to its inevitability in data-driven settings where many systems face uncertainty. One such example of concern is Bayesian Optimization (BO), where uncertainty is multi-faceted, yet there only exists a limited number of works dedicated to this direction. In particular, there is the work of Kirschner et al. (2020), which bridges the existing literature of Distributionally Robust Optimization (DRO) by casting the BO problem from the lens of DRO. While this work is pioneering, it admittedly suffers from various practical shortcomings such as finite contexts assumptions, leaving behind the main question Can one devise a computationally tractable algorithm for solving this DRO-BO problem? In this work, we tackle this question to a large degree of generality by considering robustness against data-shift in $\phi$-divergences, which subsumes many popular choices, such as the $\chi^2$-divergence, Total Variation, and the extant Kullback-Leibler (KL) divergence. We show that the DRO-BO problem in this setting is equivalent to a finite-dimensional optimization problem which, even in the continuous context setting, can be easily implemented with provable sublinear regret bounds. We then show experimentally that our method surpasses existing methods, attesting to the theoretical results
翻译:稳健性研究因其在许多系统面临不确定性的数据驱动环境中的不可避免性而引起了很大关注。例如,巴伊西亚最佳优化(BO)是值得关注的一个实例,因为不确定性是多方面的,但只有为数不多的专用于这一方向的作品。特别是,基尔希纳等人(202020年)的工作,通过从DRO的视角将BO问题从DRO的视角中呈现出来,将现有的数据转换(DRO)的文献连接起来,从而连接了Sprealally robust 优化(DRO)的现有文献。虽然这项工作是开拓性的,但它却受到各种实际缺陷的困扰,例如有限的背景假设,留下的主要问题是:一个人能否为解决DRO-BO的问题设计一种可计算可移动的算法?在这项工作中,我们通过考虑对美元和美元差异的数据转换(DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (D) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRO) (DRIl) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DR) (DI) (DV) (DR) (DV) (DR) (DV) (DR) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (DR) (D) (D) (DR) (DV) (D) (D) (D) (D) (D) (D) (D) (DR) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (D) (P) (P) (P) (P