语言模型如何做算法推理？Google Hattie Zhou《通过语境学习来教算法推理》，附Slides与论文 - 专知VIP

会员服务 ·

15

语境学习 (in-context learning) · 算法推理 ·

2023 年 3 月 10 日

语言模型如何做算法推理？Google Hattie Zhou《通过语境学习来教算法推理》，附Slides与论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型(LLMs)通过扩展模型和数据大小显示出越来越强的上下文学习能力。尽管取得了这些进展，LLM仍然无法解决算法推理问题。虽然为最终答案提供了一个基本原理，导致了多步推理问题的进一步改进，但Anil等人在2022年表明，即使是简单的算法推理任务，如parity，也远远没有解决。在这项工作中，我们确定并研究了成功地向LLMs教授算法推理的四个关键阶段:(1)将算法制定为技能，(2)同时教授多种技能(技能积累)，(3)教授如何组合技能(技能组合)以及(4)教授如何将技能用作工具。我们证明了通过上下文学习(我们称之为算法提示)向LLM教授算法推理是可能的。我们在各种算术和定量推理任务上评估了我们的方法，并证明了与现有的提示技术相比，该方法在性能上有显著提升。特别是，对于长奇偶校验、加法、乘法和减法，与最佳可用基线相比，我们分别实现了大约10倍、9倍、5倍和2倍的误差减少。

成为VIP会员查看完整内容

27

相关内容

语境学习 (in-context learning)

语境学习 (in-context learning)

【华盛顿大学博士论文】课程学习:从人类的策略到学习动力学，304页pdf

【华盛顿大学博士论文】课程学习:从人类的策略到学习动力学，304页pdf

专知会员服务

42+阅读 · 2023年3月6日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

预训练如何用于机器翻译？字节跳动ACL2021这份190页ppt教程带你全面了解

预训练如何用于机器翻译？字节跳动ACL2021这份190页ppt教程带你全面了解

专知会员服务

70+阅读 · 2021年8月2日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【MIT-ICLR2020】神经网络能推断出什么? What Can Neural Networks Reason About?

【MIT-ICLR2020】神经网络能推断出什么? What Can Neural Networks Reason About?

专知会员服务

44+阅读 · 2020年2月21日

无需强化学习的与人类偏好对齐的语言模型：Wombat袋熊

无需强化学习的与人类偏好对齐的语言模型：Wombat袋熊

PaperWeekly

5+阅读 · 2023年4月13日

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

机器之心

7+阅读 · 2023年4月9日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

DeepMind用「强化学习」训练「正能量」聊天机器人：再也不用担心AI乱说话了！

DeepMind用「强化学习」训练「正能量」聊天机器人：再也不用担心AI乱说话了！

新智元

0+阅读 · 2022年10月5日

清华陈丹琦：如何让「大模型」变小

清华陈丹琦：如何让「大模型」变小

THU数据派

11+阅读 · 2022年7月28日

人工智能学会数学推理了，考试成绩比CS博士还高

人工智能学会数学推理了，考试成绩比CS博士还高

机器之心

0+阅读 · 2022年7月1日

KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架

KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架

PaperWeekly

3+阅读 · 2022年6月27日

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

机器之心

1+阅读 · 2022年6月11日

历时2年442位作者132个机构！Google发布语言模型评价新基准BIG-bench，204个任务全面评价语言模型能力，附论文

历时2年442位作者132个机构！Google发布语言模型评价新基准BIG-bench，204个任务全面评价语言模型能力，附论文

专知

0+阅读 · 2022年6月10日

DeepMind：为什么GPT能为你写诗？

DeepMind：为什么GPT能为你写诗？

新智元

1+阅读 · 2022年6月3日

LncRNA uc001pxz.1通过BLID调控胶质瘤细胞凋亡的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

巨噬细胞lncRNA-Cox2调控的炎症反应在脓毒症心肌损伤中的作用和机制

国家自然科学基金

0+阅读 · 2013年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

高维数据的非参数经验贝叶斯方法

国家自然科学基金

1+阅读 · 2012年12月31日

高可靠软件建模语言及模型自动转换方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

第二语言学习个体差异的神经机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于案例推理和进化神经网络技术的计算机游戏智能水平研究

国家自然科学基金

2+阅读 · 2009年12月31日

偏好学习的若干关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

语言环境下群体共识过程的优化研究

国家自然科学基金

0+阅读 · 2008年12月31日

Parallel Greedy Spanners

Arxiv

0+阅读 · 2023年5月2日

Bayesian Model Selection, the Marginal Likelihood, and Generalization

Arxiv

1+阅读 · 2023年5月2日

Machine Explanations and Human Understanding

Arxiv

4+阅读 · 2023年5月1日

Incremental procedural and sensorimotor learning in cognitive humanoid robots

Arxiv

0+阅读 · 2023年4月30日

TALLRec: An Effective and Efficient Tuning Framework to Align Large Language Model with Recommendation

Arxiv

0+阅读 · 2023年4月30日

Beyond Classification: Financial Reasoning in State-of-the-Art Language Models

Arxiv

3+阅读 · 2023年4月30日

R-U-SURE? Uncertainty-Aware Code Suggestions By Maximizing Utility Across Random User Intents

Arxiv

0+阅读 · 2023年4月28日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

VIP会员

相关主题

语境学习 (in-context learning)

相关VIP内容

【华盛顿大学博士论文】课程学习:从人类的策略到学习动力学，304页pdf

【华盛顿大学博士论文】课程学习:从人类的策略到学习动力学，304页pdf

专知会员服务

42+阅读 · 2023年3月6日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

预训练如何用于机器翻译？字节跳动ACL2021这份190页ppt教程带你全面了解

预训练如何用于机器翻译？字节跳动ACL2021这份190页ppt教程带你全面了解

专知会员服务

70+阅读 · 2021年8月2日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ICML2020】统一预训练伪掩码语言模型

【ICML2020】统一预训练伪掩码语言模型

专知会员服务

27+阅读 · 2020年7月23日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【MIT-ICLR2020】神经网络能推断出什么? What Can Neural Networks Reason About?

【MIT-ICLR2020】神经网络能推断出什么? What Can Neural Networks Reason About?

专知会员服务

44+阅读 · 2020年2月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

无需强化学习的与人类偏好对齐的语言模型：Wombat袋熊

无需强化学习的与人类偏好对齐的语言模型：Wombat袋熊

PaperWeekly

5+阅读 · 2023年4月13日

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

首次：微软用GPT-4做大模型指令微调，新任务零样本性能再提升

机器之心

7+阅读 · 2023年4月9日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

DeepMind用「强化学习」训练「正能量」聊天机器人：再也不用担心AI乱说话了！

DeepMind用「强化学习」训练「正能量」聊天机器人：再也不用担心AI乱说话了！

新智元

0+阅读 · 2022年10月5日

清华陈丹琦：如何让「大模型」变小

清华陈丹琦：如何让「大模型」变小

THU数据派

11+阅读 · 2022年7月28日

人工智能学会数学推理了，考试成绩比CS博士还高

人工智能学会数学推理了，考试成绩比CS博士还高

机器之心

0+阅读 · 2022年7月1日

KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架

KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架

PaperWeekly

3+阅读 · 2022年6月27日

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

送给大模型的「高考」卷：442人联名论文给大模型提出204个任务，谷歌领衔

机器之心

1+阅读 · 2022年6月11日

历时2年442位作者132个机构！Google发布语言模型评价新基准BIG-bench，204个任务全面评价语言模型能力，附论文

历时2年442位作者132个机构！Google发布语言模型评价新基准BIG-bench，204个任务全面评价语言模型能力，附论文

专知

0+阅读 · 2022年6月10日

DeepMind：为什么GPT能为你写诗？

DeepMind：为什么GPT能为你写诗？

新智元

1+阅读 · 2022年6月3日

相关基金

LncRNA uc001pxz.1通过BLID调控胶质瘤细胞凋亡的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

学习理论中相似度量学习及相关课题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

巨噬细胞lncRNA-Cox2调控的炎症反应在脓毒症心肌损伤中的作用和机制

国家自然科学基金

0+阅读 · 2013年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

高维数据的非参数经验贝叶斯方法

国家自然科学基金

1+阅读 · 2012年12月31日

高可靠软件建模语言及模型自动转换方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

第二语言学习个体差异的神经机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于案例推理和进化神经网络技术的计算机游戏智能水平研究

国家自然科学基金

2+阅读 · 2009年12月31日

偏好学习的若干关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

语言环境下群体共识过程的优化研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Parallel Greedy Spanners

Arxiv

0+阅读 · 2023年5月2日

Bayesian Model Selection, the Marginal Likelihood, and Generalization

Arxiv

1+阅读 · 2023年5月2日

Machine Explanations and Human Understanding

Arxiv

4+阅读 · 2023年5月1日

Incremental procedural and sensorimotor learning in cognitive humanoid robots

Arxiv

0+阅读 · 2023年4月30日

TALLRec: An Effective and Efficient Tuning Framework to Align Large Language Model with Recommendation

Arxiv

0+阅读 · 2023年4月30日

Beyond Classification: Financial Reasoning in State-of-the-Art Language Models

Arxiv

3+阅读 · 2023年4月30日

R-U-SURE? Uncertainty-Aware Code Suggestions By Maximizing Utility Across Random User Intents

Arxiv

0+阅读 · 2023年4月28日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

微信扫码咨询专知VIP会员