组合在线学习:实时反馈玩转组合优化
微软研究院AI头条
3+阅读 · 2017年10月12日
Bandit:一款Python代码安全漏洞检测工具
FreeBuf
0+阅读 · 2019年6月15日
SFFAI 34 报名通知 | 《强化学习》 书籍共读
人工智能前沿讲习班
2+阅读 · 2019年6月17日
实战 | 在 Room 中使用 Flow
谷歌开发者
1+阅读 · 2020年7月5日
Netflix用机器学习为你推送专属电视剧封面
论智
0+阅读 · 2017年12月11日
一文读懂 Netflix 的推荐探索策略 Contextual Bandits
人工智能头条
3+阅读 · 2018年1月9日
Bandit算法在携程推荐系统中的应用与实践
DataFunTalk
3+阅读 · 2020年4月19日
【经典书】贝叶斯强化学习概述,147页pdf
专知
4+阅读 · 2021年11月21日
强化学习——多臂老虎机问题
论智
6+阅读 · 2018年6月24日
推荐系统中的冷启动和探索利用问题探讨
量子位
3+阅读 · 2017年7月14日
多任务学习时转角遇到Bandit老虎机
夕小瑶的卖萌屋
4+阅读 · 2019年10月13日
参考链接
微信扫码咨询专知VIP会员