【普林斯顿博士论文】高效决策背后的结构化表征 - 专知VIP

会员服务 ·

1

博士论文 · 高效决策 · 结构化表征 ·

【普林斯顿博士论文】高效决策背后的结构化表征

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

优化的序列决策

优化的序列决策需要考虑大量潜在的行动序列，并随着每一步的推进，未来的选择空间呈指数级增长。决策的理论难度因人类和其他动物面临的资源限制而进一步加剧，例如有限的时间和记忆。虽然这些限制通常被认为是次优行为的原因，但新兴的资源理性框架则持不同观点，认为看似次优的行为实际上是为了适应这些限制而调节的，并且合理利用有限的资源。本文关注人类和其他动物在适应性简化决策时采用的两种主要方法。

第一种方法是层级表征，因其直观的吸引力而被广泛关注，适当选择层级可以将复杂任务分解为更简单的子任务。我们开发了一个资源理性框架，其中子目标是根据它们如何简化规划的高成本过程来选择的。我们在仿真中发现了这个框架与其他理论的创新性联系，且框架的预测与大规模行为实验中的人类行为一致。在另一项研究中，我们进行了一个过程追踪实验，参与者创建了层级结构的程序，并识别出一种关于重用的启发式偏差，这种偏差指导了层级表征的形成。我们考虑的第二种主要方法是强化学习任务中的启发式策略。我们提出了一个策略推断框架，其中策略被表述为程序，并根据它们的任务表现和复杂性进行评估。通过聚焦于强盗问题的仿真，我们研究了策略如何根据对复杂性的权重变化以及与先前研究中行为特征的关系而变化。

成为VIP会员查看完整内容

1

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

21+阅读 · 5月25日

【伯克利博士论文】神经网络中的结构与表征

【伯克利博士论文】神经网络中的结构与表征

专知会员服务

45+阅读 · 5月12日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

39+阅读 · 2023年9月19日

【MIT博士论文】序列博弈中的近似最优学习, 338页pdf

【MIT博士论文】序列博弈中的近似最优学习, 338页pdf

专知会员服务

34+阅读 · 2023年8月31日

大模型如何决策？上交大等最新《面向序列决策的大序列模型》综述

大模型如何决策？上交大等最新《面向序列决策的大序列模型》综述

专知会员服务

109+阅读 · 2023年6月28日

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

专知会员服务

24+阅读 · 2023年5月21日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

专知会员服务

53+阅读 · 2023年4月12日

【博士论文】弱反馈的序列决策问题

【博士论文】弱反馈的序列决策问题

专知会员服务

22+阅读 · 2023年1月2日

【ICML2022】可达性约束强化学习

【ICML2022】可达性约束强化学习

专知会员服务

22+阅读 · 2022年5月18日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

44+阅读 · 2022年5月10日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

32+阅读 · 2023年4月13日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

26+阅读 · 2022年7月7日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

11+阅读 · 2020年7月21日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

75+阅读 · 2019年10月20日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

39+阅读 · 2018年3月19日

现代情感分析方法

现代情感分析方法

算法与数学之美

14+阅读 · 2018年1月12日

相依结构不确定下的聚合风险问题

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

有限理性下的最优停止理论及应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

25+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定环境下的社会网络影响扩散序贯决策优化研究

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

3+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

Estimating odds and log odds with guaranteed accuracy

Arxiv

0+阅读 · 11月25日

Offline reinforcement learning for job-shop scheduling problems

Arxiv

0+阅读 · 11月25日

Quantum computing with error mitigation for data-driven computational homogenization

Arxiv

0+阅读 · 11月22日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

157+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

90+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

173+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

399+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

20+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

VIP会员

相关主题

结构化表征

相关VIP内容

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

21+阅读 · 5月25日

【伯克利博士论文】神经网络中的结构与表征

【伯克利博士论文】神经网络中的结构与表征

专知会员服务

45+阅读 · 5月12日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

39+阅读 · 2023年9月19日

【MIT博士论文】序列博弈中的近似最优学习, 338页pdf

【MIT博士论文】序列博弈中的近似最优学习, 338页pdf

专知会员服务

34+阅读 · 2023年8月31日

大模型如何决策？上交大等最新《面向序列决策的大序列模型》综述

大模型如何决策？上交大等最新《面向序列决策的大序列模型》综述

专知会员服务

109+阅读 · 2023年6月28日

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

专知会员服务

24+阅读 · 2023年5月21日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

专知会员服务

53+阅读 · 2023年4月12日

【博士论文】弱反馈的序列决策问题

【博士论文】弱反馈的序列决策问题

专知会员服务

22+阅读 · 2023年1月2日

【ICML2022】可达性约束强化学习

【ICML2022】可达性约束强化学习

专知会员服务

22+阅读 · 2022年5月18日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

44+阅读 · 2022年5月10日

热门VIP内容

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

32+阅读 · 2023年4月13日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

26+阅读 · 2022年7月7日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

11+阅读 · 2020年7月21日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

75+阅读 · 2019年10月20日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

39+阅读 · 2018年3月19日

现代情感分析方法

现代情感分析方法

算法与数学之美

14+阅读 · 2018年1月12日

相关基金

相依结构不确定下的聚合风险问题

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

有限理性下的最优停止理论及应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

25+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定环境下的社会网络影响扩散序贯决策优化研究

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

3+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Estimating odds and log odds with guaranteed accuracy

Arxiv

0+阅读 · 11月25日

Offline reinforcement learning for job-shop scheduling problems

Arxiv

0+阅读 · 11月25日

Quantum computing with error mitigation for data-driven computational homogenization

Arxiv

0+阅读 · 11月22日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

157+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

90+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

173+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

399+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

20+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

微信扫码咨询专知VIP会员