This paper studies the sample complexity (aka number of comparisons) bounds for the active best-$k$ items selection from pairwise comparisons. From a given set of items, the learner can make pairwise comparisons on every pair of items, and each comparison returns an independent noisy result about the preferred item. At any time, the learner can adaptively choose a pair of items to compare according to past observations (i.e., active learning). The learner's goal is to find the (approximately) best-$k$ items with a given confidence, while trying to use as few comparisons as possible. In this paper, we study two problems: (i) finding the probably approximately correct (PAC) best-$k$ items and (ii) finding the exact best-$k$ items, both under strong stochastic transitivity and stochastic triangle inequality. For PAC best-$k$ items selection, we first show a lower bound and then propose an algorithm whose sample complexity upper bound matches the lower bound up to a constant factor. For the exact best-$k$ items selection, we first prove a worst-instance lower bound. We then propose two algorithms based on our PAC best items selection algorithms: one works for $k=1$ and is sample complexity optimal up to a loglog factor, and the other works for all values of $k$ and is sample complexity optimal up to a log factor.
翻译:本文从对称比较中研究最有效- 美元项目选择的抽样复杂性( 比较数量) 。 从给定的一组项目中, 学习者可以对每对项目进行对比比较, 每次比较都返回对优先项目的独立噪音结果。 学习者可以随时根据以往的观察( 积极学习), 适应性地选择一对项目来比较。 学习者的目标是找到( 大约) 最有效- 美元项目, 具有一定的自信, 并尽量使用较少的比较。 在本文中, 我们研究两个问题:( 一) 找到可能大致正确( PAC) 最佳- 美元项目, 并且( 二) 找到准确的最好- 美元项目, 并且( 二) 找到准确的最好- 美元项目, 并且( 一) 最差的过渡性、 三角性不平等性项目。 关于最佳- 选择, 我们首先显示一个更低的, 然后提出一种方法, 最差的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最优的, 最