TSEC:试验制约下在线实验框架 (TSEC: a framework for online experimentation under experimental constraints) - 专知论文

会员服务 ·

0

约束 · 优化器 · MoDELS · 可辨认的 · ARM ·

2021 年 1 月 17 日

TSEC: a framework for online experimentation under experimental constraints

翻译：TSEC:试验制约下在线实验框架

Simon Mak,Yuanshuo Zhou,Lavonne Hoang,C. F. Jeff Wu

Thompson sampling is a popular algorithm for solving multi-armed bandit problems, and has been applied in a wide range of applications, from website design to portfolio optimization. In such applications, however, the number of choices (or arms) $N$ can be large, and the data needed to make adaptive decisions require expensive experimentation. One is then faced with the constraint of experimenting on only a small subset of $K \ll N$ arms within each time period, which poses a problem for traditional Thompson sampling. We propose a new Thompson Sampling under Experimental Constraints (TSEC) method, which addresses this so-called "arm budget constraint". TSEC makes use of a Bayesian interaction model with effect hierarchy priors, to model correlations between rewards on different arms. This fitted model is then integrated within Thompson sampling, to jointly identify a good subset of arms for experimentation and to allocate resources over these arms. We demonstrate the effectiveness of TSEC in two problems with arm budget constraints. The first is a simulated website optimization study, where TSEC shows noticeable improvements over industry benchmarks. The second is a portfolio optimization application on industry-based exchange-traded funds, where TSEC provides more consistent and greater wealth accumulation over standard investment strategies.

翻译：汤普森取样是一种解决多武装土匪问题的流行算法,已经应用于从网站设计到组合优化等广泛应用,从网站设计到组合优化。但是,在这类应用中,选择(或武器)的金额可能很大,而作出适应性决定所需的数据需要昂贵的实验。然后,每个时间段内只能试验少量的一小块一毛一毛军火,给传统的汤普森取样造成问题。我们提议在实验性制约下采用新的汤普森取样法,解决所谓的“武器预算限制 ” 。贸易安全委员会利用贝叶斯互动模式与前级效应的相互作用模式,模拟不同武器奖励的相互关系。然后,这种合适的模式被纳入汤普森取样,共同确定用于试验的一小块军火,并分配这些武器的资源。我们展示了贸易安全委员会在两个武器预算限制问题中的有效性。我们首先模拟了网站优化研究,其中,贸易安全委员会展示了工业基准的显著改进。第二,是对基于行业的交易所基金进行组合优化应用,其投资提供更加一致和更加标准的积累战略。

0

相关内容

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知会员服务

78+阅读 · 2021年1月30日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

【干货书】Python程序员编程，810页pdf，Python® for Programmers

【干货书】Python程序员编程，810页pdf，Python® for Programmers

专知会员服务

62+阅读 · 2020年8月6日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【ACM Multimedia 2019 Tutorial】机器学习音频和多媒体数据的再现性和实验设计（Reproducibility and Experimental Design for Machine Learning on Audio and Multimedia Data），Gerald Friedland

【ACM Multimedia 2019 Tutorial】机器学习音频和多媒体数据的再现性和实验设计（Reproducibility and Experimental Design for Machine Learning on Audio and Multimedia Data），Gerald Friedland

专知会员服务

5+阅读 · 2019年11月18日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

专知会员服务

79+阅读 · 2019年10月10日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

计算机类 | PLDI 2020等国际会议信息6条

计算机类 | PLDI 2020等国际会议信息6条

Call4Papers

3+阅读 · 2019年7月8日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Disentangled的假设的探讨

Disentangled的假设的探讨

CreateAMind

9+阅读 · 2018年12月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

已删除

将门创投

4+阅读 · 2018年6月4日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

Internal contact modeling for finite strain topology optimization

Arxiv

0+阅读 · 2021年3月12日

ENTMOOT: A Framework for Optimization over Ensemble Tree Models

Arxiv

0+阅读 · 2021年3月12日

Online Constraint Satisfaction for MDP Congestion Games

Arxiv

0+阅读 · 2021年3月11日

Graph Neural Networks Inspired by Classical Iterative Algorithms

Graph Neural Networks Inspired by Classical Iterative Algorithms

Arxiv

4+阅读 · 2021年3月10日

A sampling criterion for constrained Bayesian optimization with uncertainties

Arxiv

0+阅读 · 2021年3月9日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Learning to Infer User Hidden States for Online Sequential Advertising

Arxiv

9+阅读 · 2020年9月3日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

Structured Query Construction via Knowledge Graph Embedding

Structured Query Construction via Knowledge Graph Embedding

Arxiv

6+阅读 · 2019年9月6日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

VIP会员

文章信息

相关主题

相关VIP内容

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知会员服务

78+阅读 · 2021年1月30日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

【干货书】Python程序员编程，810页pdf，Python® for Programmers

【干货书】Python程序员编程，810页pdf，Python® for Programmers

专知会员服务

62+阅读 · 2020年8月6日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【ACM Multimedia 2019 Tutorial】机器学习音频和多媒体数据的再现性和实验设计（Reproducibility and Experimental Design for Machine Learning on Audio and Multimedia Data），Gerald Friedland

【ACM Multimedia 2019 Tutorial】机器学习音频和多媒体数据的再现性和实验设计（Reproducibility and Experimental Design for Machine Learning on Audio and Multimedia Data），Gerald Friedland

专知会员服务

5+阅读 · 2019年11月18日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

专知会员服务

79+阅读 · 2019年10月10日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《代码、指挥与冲突：描绘军事人工智能的未来》报告

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

美国启动“自有军事人工智能计划”：采用谷歌Gemini以推动全军人工智能应用

《创新与适应性作为军事成功的关键因素：来自俄乌战争的战略洞见》报告

相关资讯

计算机类 | PLDI 2020等国际会议信息6条

计算机类 | PLDI 2020等国际会议信息6条

Call4Papers

3+阅读 · 2019年7月8日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

Disentangled的假设的探讨

Disentangled的假设的探讨

CreateAMind

9+阅读 · 2018年12月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

已删除

将门创投

4+阅读 · 2018年6月4日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

相关论文

Internal contact modeling for finite strain topology optimization

Arxiv

0+阅读 · 2021年3月12日

ENTMOOT: A Framework for Optimization over Ensemble Tree Models

Arxiv

0+阅读 · 2021年3月12日

Online Constraint Satisfaction for MDP Congestion Games

Arxiv

0+阅读 · 2021年3月11日

Graph Neural Networks Inspired by Classical Iterative Algorithms

Graph Neural Networks Inspired by Classical Iterative Algorithms

Arxiv

4+阅读 · 2021年3月10日

A sampling criterion for constrained Bayesian optimization with uncertainties

Arxiv

0+阅读 · 2021年3月9日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Learning to Infer User Hidden States for Online Sequential Advertising

Arxiv

9+阅读 · 2020年9月3日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

Structured Query Construction via Knowledge Graph Embedding

Structured Query Construction via Knowledge Graph Embedding

Arxiv

6+阅读 · 2019年9月6日

Learning Discriminative Model Prediction for Tracking

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

微信扫码咨询专知VIP会员