最优策略热门内容 - 专知

会员服务 ·

最优策略

最优策略亦称“平衡策略”、“稳定策略”。在对策中，能够形成平衡局势的局中人的策略。最优策略构成对策的解。它根据局中人选取策略的形式是有目的地选取，还是根据一定的概率值随机地选取，分成最优纯策略和最优混合策略两类。在有鞍点的矩阵对策中，参与对策的局中人根据鞍点选取并构成平衡局势的策略为最优纯策略。在没有鞍点的矩阵决策中，参与对策的局中人的最优策略为最优混合决策。

双11规则是如何歧视你的智商的？

双11规则是如何歧视你的智商的？

卢松松

0+阅读 · 2017年11月8日

没有模型如何进行强化学习——蒙特卡洛方法

没有模型如何进行强化学习——蒙特卡洛方法

机器人学家

2+阅读 · 2017年2月21日

AI版权征文 | 论人工智能生成的内容在著作权法中的定性（下篇）

AI版权征文 | 论人工智能生成的内容在著作权法中的定性（下篇）

百度公共政策研究院

0+阅读 · 2018年10月30日

由炮灰模型到“微软钻石题”

由炮灰模型到“微软钻石题”

算法与数学之美

0+阅读 · 2017年11月24日

【AlphaGo核心技术-教程学习笔记03】深度强化学习第三讲动态规划寻找最优策略

【AlphaGo核心技术-教程学习笔记03】深度强化学习第三讲动态规划寻找最优策略

专知

10+阅读 · 2017年10月22日

人工智能再下一城，在多人扑克中大胜人类

人工智能再下一城，在多人扑克中大胜人类

知识分子

1+阅读 · 2019年7月12日

强化学习如何真正实现任务自动化？不妨试试「两步走」策略！

强化学习如何真正实现任务自动化？不妨试试「两步走」策略！

AI科技评论

0+阅读 · 2019年10月7日

漫画 | 算法难题：海盗如何分金币？

漫画 | 算法难题：海盗如何分金币？

程序人生

0+阅读 · 2019年1月17日

外国电影起名指北

外国电影起名指北

虎嗅网

0+阅读 · 2019年3月30日

【年度巨制】2018肿瘤资讯肠癌年终盘点，后天起每日一集，重磅来袭！

【年度巨制】2018肿瘤资讯肠癌年终盘点，后天起每日一集，重磅来袭！

肿瘤资讯

0+阅读 · 2019年1月18日

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

专知

6+阅读 · 2020年8月22日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

从央视到谷歌：聊一聊竞价广告的机制设计

从央视到谷歌：聊一聊竞价广告的机制设计

互联网er的早读课

1+阅读 · 2018年7月6日

一文带你理解Q-Learning的搜索策略，掌握强化学习最常用算法

一文带你理解Q-Learning的搜索策略，掌握强化学习最常用算法

量子位

0+阅读 · 2018年5月19日

是否要入坑强化学习，看了这篇文章再说

是否要入坑强化学习，看了这篇文章再说

PaperWeekly

0+阅读 · 2020年8月17日

参考链接

微信扫码咨询专知VIP会员