【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发 - 专知VIP

会员服务 ·

17

博士论文 · 大语言模型 · 代码生成 · 知识增强 ·

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我们每天都与计算机互动。尽管如今操作计算机的用户体验已经变得前所未有的简单，但仍存在一些障碍，阻碍用户充分发挥其潜力。其中一个例子是编程语言的学习曲线。程序员一直梦想着有更简单、更智能的工具来辅助他们的工作，从而使开发变得更加轻松。不懂编程的终端用户也将受益于一种更自然的方式来指导计算机完成某些定制任务，即将计算机转变为他们的个人智能体，以高度的自主性和指令执行能力完成各种任务。这与我们如何轻松地用自然语言（如英语）表达目标和愿望形成了鲜明对比。在本论文中，我们提出将自然语言与编程语言以及日常生活在线环境中的可执行操作相连接。这项工作的预期目标是构建模型、环境和评估方法，既用于编程任务中的代码生成，也用于日常生活和工作场所中的大型语言模型（LLM）智能体，特别关注利用大规模数据源和外部知识进行模型预训练和检索增强模型。我们从四个角度探讨这一问题，构成了论文的四个部分。在第一部分中，我们探索代码生成模型的预训练。接下来，在第二部分中，我们进行代码生成的人类研究。然后，在第三部分中，我们改进检索增强模型。最后，在第四部分中，我们探索将 LLM 作为智能体的交互式使用。

成为VIP会员查看完整内容

24

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【NTU博士论文】让语言模型成为更类人的学习者

【NTU博士论文】让语言模型成为更类人的学习者

专知会员服务

23+阅读 · 9月23日

【NYU博士论文】面向开放世界的人工智能：学习原则

【NYU博士论文】面向开放世界的人工智能：学习原则

专知会员服务

41+阅读 · 4月26日

【NUS博士论文】视频语义理解的因果模型

【NUS博士论文】视频语义理解的因果模型

专知会员服务

10+阅读 · 3月19日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

19+阅读 · 3月11日

【博士论文】迈向值得信赖的视觉生成模型：扩散模型的可靠且可控生成

【博士论文】迈向值得信赖的视觉生成模型：扩散模型的可靠且可控生成

专知会员服务

16+阅读 · 1月27日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

19+阅读 · 2024年11月29日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

34+阅读 · 2024年8月23日

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

专知会员服务

29+阅读 · 2024年8月15日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

43+阅读 · 2024年2月2日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

开放知识图谱

10+阅读 · 2022年8月8日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

深度学习与NLP

14+阅读 · 2018年12月30日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向服务的复杂产品设计建模与协同决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

177+阅读 · 2023年3月24日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

大语言模型

相关VIP内容

【NTU博士论文】让语言模型成为更类人的学习者

【NTU博士论文】让语言模型成为更类人的学习者

专知会员服务

23+阅读 · 9月23日

【NYU博士论文】面向开放世界的人工智能：学习原则

【NYU博士论文】面向开放世界的人工智能：学习原则

专知会员服务

41+阅读 · 4月26日

【NUS博士论文】视频语义理解的因果模型

【NUS博士论文】视频语义理解的因果模型

专知会员服务

10+阅读 · 3月19日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

19+阅读 · 3月11日

【博士论文】迈向值得信赖的视觉生成模型：扩散模型的可靠且可控生成

【博士论文】迈向值得信赖的视觉生成模型：扩散模型的可靠且可控生成

专知会员服务

16+阅读 · 1月27日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

19+阅读 · 2024年11月29日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

34+阅读 · 2024年8月23日

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

专知会员服务

29+阅读 · 2024年8月15日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

43+阅读 · 2024年2月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

开放知识图谱

10+阅读 · 2022年8月8日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

深度学习与NLP

14+阅读 · 2018年12月30日

相关基金

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向服务的复杂产品设计建模与协同决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

177+阅读 · 2023年3月24日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员