In black-box optimization problems, we aim to maximize an unknown objective function, where the function is only accessible through feedbacks of an evaluation or simulation oracle. In real-life, the feedbacks of such oracles are often noisy and available after some unknown delay that may depend on the computation time of the oracle. Additionally, if the exact evaluations are expensive but coarse approximations are available at a lower cost, the feedbacks can have multi-fidelity. In order to address this problem, we propose a generic extension of hierarchical optimistic tree search (HOO), called ProCrastinated Tree Search (PCTS), that flexibly accommodates a delay and noise-tolerant bandit algorithm. We provide a generic proof technique to quantify regret of PCTS under delayed, noisy, and multi-fidelity feedbacks. Specifically, we derive regret bounds of PCTS enabled with delayed-UCB1 (DUCB1) and delayed-UCB-V (DUCBV) algorithms. Given a horizon $T$, PCTS retains the regret bound of non-delayed HOO for expected delay of $O(\log T)$ and worsens by $O(T^{\frac{1-\alpha}{d+2}})$ for expected delays of $O(T^{1-\alpha})$ for $\alpha \in (0,1]$. We experimentally validate on multiple synthetic functions and hyperparameter tuning problems that PCTS outperforms the state-of-the-art black-box optimization methods for feedbacks with different noise levels, delays, and fidelity.
翻译:在黑盒优化问题中,我们的目标是最大限度地增加一个未知的目标功能,即该功能只能通过评价或模拟器的反馈来获取。在现实生活中,这些神器的反馈往往很吵,在可能取决于神器的计算时间的某种不知名的延迟之后可以得到。此外,如果准确的评价费用昂贵,但粗略的近似以较低的成本提供,那么反馈可能具有多纤维性。为了解决这一问题,我们提议将等级乐观树搜索(HOO)(称为ProCrattic 树搜索(PCTS))的通用扩展,该功能可灵活地适应延迟和耐噪音的延迟。在现实生活中,这些神器的反馈往往很吵闹,在某种不知名的延迟、噪音和多纤维性反馈下,我们用延迟的UCBB1 (DUCB1) 和延迟的UCB-V (DCBV) 算法产生遗憾。鉴于地平价值为美元,PCTTT(PLT) 保留非延迟的HOOOO(美元)预期延迟的美元(T)和美元(O_Q_BAR_BAR_BAR) 的美元) 水平,以及美元(美元/美元)预期的货币-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-