The goal of a sequential decision making problem is to design an interactive policy that adaptively selects a group of items, each selection is based on the feedback from the past, in order to maximize the expected utility of selected items. It has been shown that the utility functions of many real-world applications are adaptive submodular. However, most of existing studies on adaptive submodular optimization focus on the average-case. Unfortunately, a policy that has a good average-case performance may have very poor performance under the worst-case realization. In this study, we propose to study two variants of adaptive submodular optimization problems, namely, worst-case adaptive submodular maximization and robust submodular maximization. The first problem aims to find a policy that maximizes the worst-case utility and the latter one aims to find a policy, if any, that achieves both near optimal average-case utility and worst-case utility simultaneously. We introduce a new class of stochastic functions, called \emph{worst-case submodular function}. For the worst-case adaptive submodular maximization problem subject to a $p$-system constraint, we develop an adaptive worst-case greedy policy that achieves a $\frac{1}{p+1}$ approximation ratio against the optimal worst-case utility if the utility function is worst-case submodular. For the robust adaptive submodular maximization problem subject to cardinality constraints (resp. partition matroid constraints), if the utility function is both worst-case submodular and adaptive submodular, we develop a hybrid adaptive policy that achieves an approximation close to $1-e^{-\frac{1}{2}}$ (resp. $1/3$) under both worst- and average-case settings simultaneously. We also describe several applications of our theoretical results, including pool-base active learning, stochastic submodular set cover and adaptive viral marketing.
翻译:顺序决策问题的目标是设计一个互动政策, 适应性地选择一组项目, 每个选择都基于来自过去的反馈, 以便最大限度地实现选定项目的预期效用。 已经显示, 许多真实世界应用程序的效用功能是适应性亚模块。 但是, 大多数关于适应性亚模块优化的现有研究都以平均情况为重点。 不幸的是, 在最坏的实现中, 一个具有良好平均业绩的政策可能表现非常差。 在此研究中, 我们提议研究两个适应性亚模块优化问题的变体, 即最坏的适应性亚模块最大化和稳健性亚模块最大化。 第一个问题的目的是找到一个使最坏情况应用程序的效用最大化的政策, 后一个目标是找到一种既能达到接近最佳平均效果又能同时达到最坏情况的政策效果的政策。 我们引入了一种新的随机功能, 称为 emph{wormorld- 情况子模块功能 。 对于最坏的适应性子模块, 我们也可以在最坏的次模式下实现最坏的子模块最大化, 最坏的 最坏的策略选项是最坏的, 如果最坏的 最坏的 最坏的 最坏的版本的 的 的 的 最坏的策略 的 的策略的策略的, 我们的 最坏的, 我们的 最坏的 最坏的 最坏的 最坏的 最坏的 最坏的 最坏的 最坏的 最坏的 最坏的 的 最坏的 的 的 的 的 最坏的 最坏的 的 的 的 的 的 的 的 的 的 的 最坏的 的 的 的 最坏的 的 的 的 的 最坏的 最坏的 的 最坏的 的 的 的 的 的 的 的 的 的 最坏的 的 的 最坏的 最坏的 的 最坏的 的 的 最坏的 最坏的 最坏的 的 的 的 最坏的 的 的 的 的 的 的 的 最坏的 最坏的 最坏的 最坏的 的 最坏的 的 最坏的 最坏的