We study the problem of contextual search in the adversarial noise model. Let $d$ be the dimension of the problem, $T$ be the time horizon and $C$ be the total amount of noise in the system. For the $\eps$-ball loss, we give a tight regret bound of $O(C + d \log(1/\eps))$ improving over the $O(d^3 \log(1/\eps)) \log^2(T) + C \log(T) \log(1/\eps))$ bound of Krishnamurthy et al (STOC21). For the symmetric loss, we give an efficient algorithm with regret $O(C+d \log T)$. Our techniques are a significant departure from prior approaches. Specifically, we keep track of density functions over the candidate vectors instead of a knowledge set consisting of the candidate vectors consistent with the feedback obtained.
翻译:我们在对抗性噪音模型中研究背景搜索问题。 让美元成为问题的层面, 美元是时间范围, 美元是系统中的噪音总量。 对于美元/ 美元/ 球损失, 我们给出了强烈的遗憾, 美元/ 美元( c+ d log(1 \ \ / / / / ) 美元)比 美元( d3 \ log ( 1/ \ \ ps)) / log2 ( T) + C\ log( T) = log( 1/ \ eps) / 美元( Krishnamurthy et al ( STOC21) ) 捆绑在一起。 对于对等式损失, 我们给出了一种有效的算法, 遗憾为 $/ ( C+ d\ log T) 。 我们的技术大大偏离了先前的方法 。 具体地说, 我们跟踪候选矢量的密度功能, 而不是根据获得的反馈, 由候选矢量组成的一套知识 。