A Happiness Maximizing Set (HMS) is a useful concept in which a smaller subset of a database is selected while mostly preserving the best scores along every possible utility function. In this paper, we study the $k$-Happiness Maximizing Sets ($k$-HMS) and Average Happiness Maximizing Sets (AHMS) problems. Specifically, $k$-HMS selects $r$ records from the database such that the minimum happiness ratio between the $k$-th best score in the database and the best score in the selected records for any possible utility function is maximized. Meanwhile, AHMS maximizes the average of this ratio within a distribution of utility functions. $k$-HMS and AHMS are equivalent to the more established $k$-Regret Minimizing Sets ($k$-RMS) and Average Regret Minimizing Sets (ARMS) problems, but allow for the derivation of stronger theoretical results and more natural approximation schemes. In this paper, we show that the problem of approximating $k$-HMS within any finite factor is NP-Hard when the dimensionality of the database is unconstrained and extend the result to an inapproximability proof of $k$-RMS. We then provide approximation algorithms for AHMS with better approximation ratios and time complexities than known algorithms for ARMS. Finally, we provide dataset reduction schemes which can be used to reduce the runtime of existing heuristic based algorithms, as well as to derive polynomial-time approximation schemes for both $k$-HMS and AHMS when dimensionality is fixed. Finally, we provide experimental validation showing that our AHMS algorithm achieves the same happiness as the existing Greedy Shrink FAM algorithm while running faster by over 2 orders of magnitude on even a small dataset of 17265 data points while our reduction scheme was able to reduce runtimes by up to 93% (from 4.2 hours to 16.7 minutes) while keeping happiness within 90\% of the original on the largest tested settings.


翻译:幸福最大化 Set (HMS) 是一个有用的概念, 在其中选择一个数据库中一个较小部分的精细的亚化算法, 而在每一个可能的通用函数中保留最优的分数。 在本文中, 我们研究美元- 幸福最大化 Set (k$- HMS) 和平均幸福最大化 Set (AHMS) 问题。 具体地说, $k$- HMS 从数据库中选择美元记录, 使数据库中最优分数的美元- 第七个最高分和任何可能的通用函数所选记录中最优分之间的最低幸福率比例最大化。 与此同时, AHMS 将这个比率的平均值最大化。 美元- HMS 和 AHMS 之间的平均幸福率最大化( 美元- Regret $- RMS ) 和 平均 Regregregret remination Setcremination Set) 问题。 但允许从数据库中得出更强的理论结果, 17 更自然更接近方案。 在本文中, 我们显示, 当任何固定的 将美元- HMS 的 继续维持 $ 的 RIS max 的数值在任何 的数值中, 的 的 IM 中, 的 将 的 的 将 的 的 的 的 将 的 的 的 的 的 以 的 的 的 的 的 的 将 的 的 的 的 的 降为最短的 降为, 的 的 的 的 的 降为, 的 的 的 的 的 的 的 向, 向, 当我们的 向后 向后 向后 向的 提供 的 的 的 的 的 的 的 的 向的 向 向 向 向, 向的 向, 提供 向, 提供 提供 提供 提供 提供 提供 提供 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 向 提供 提供 提供 提供 提供 提供 的 最短的 的 最短的 的 向的

0
下载
关闭预览

相关内容

专知会员服务
50+阅读 · 2020年12月14日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
已删除
将门创投
4+阅读 · 2017年12月12日
Arxiv
3+阅读 · 2018年10月18日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关资讯
已删除
将门创投
4+阅读 · 2017年12月12日
Top
微信扫码咨询专知VIP会员