ChatGPT大模型技术发展与应用 - 专知VIP

会员服务 ·

83

ChatGPT · 大模型 · 指令学习 · 监督微调 · 人类反馈强化学习 (RLHF) ·

2023 年 12 月 3 日

ChatGPT大模型技术发展与应用

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

通过回顾深度学习、语言模型、语义表示和预训练技术的发展历程，全面解析了ChatGPT的技术渊源和演进路线。在语言模型方面，从早期的N-gram统计方法逐步演进到神经网络语言模型，通过对机器翻译技术的研究和影响也催生了Transformer的出现，继而又推动了神经网络语言模型的发展。在语义表示和预训练技术发展方面，从早期的TF-IDF、pLSA和LDA等统计方法发展到Word2Vec等基于神经网络的词向量表示，继而发展到ELMo、BERT和GPT-2等预训练语言模型，预训练框架日益成熟，为模型提供了丰富的语义知识。GPT-3的出现揭示了大语言模型的潜力，但依然存在幻觉问题，如生成不可控、知识谬误及逻辑推理能力差等。为了缓解这些问题，ChatGPT通过指令学习、监督微调、基于人类反馈的强化学习等方式在GPT-3.5上进一步与人类进行对齐学习，效果不断提升。ChatGPT等大模型的出现，标志着该领域技术进入新的发展阶段，为人机交互以及通用人工智能的发展开辟了新的可能。

成为VIP会员查看完整内容

相关内容

ChatGPT

ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序 [1] ，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文任务。 [1] https://openai.com/blog/chatgpt/

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

专知会员服务

59+阅读 · 2023年10月19日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

77+阅读 · 2023年10月6日

基于UNet的医学图像分割综述

基于UNet的医学图像分割综述

专知会员服务

38+阅读 · 2023年8月8日

超大预训练模型在指挥控制领域的应用与挑战

超大预训练模型在指挥控制领域的应用与挑战

专知会员服务

95+阅读 · 2023年5月26日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

217+阅读 · 2023年5月9日

深度学习在光声成像中的应用综述

深度学习在光声成像中的应用综述

专知会员服务

27+阅读 · 2022年5月23日

人工神经网络模型发展及应用综述

专知会员服务

42+阅读 · 2021年6月2日

AI芯片发展现状及前景分析

专知会员服务

66+阅读 · 2021年5月2日

工业人工智能的关键技术及其在预测性维护中的应用现状

工业人工智能的关键技术及其在预测性维护中的应用现状

专知会员服务

92+阅读 · 2020年11月4日

基于几何深度学习的知识图谱关键技术研究进展

专知会员服务

131+阅读 · 2020年7月10日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

53+阅读 · 2022年4月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

3倍加速CPU上的BERT模型部署

3倍加速CPU上的BERT模型部署

ApacheMXNet

11+阅读 · 2020年7月13日

AIoT（一）丨产业的发展历程与市场概况

AIoT（一）丨产业的发展历程与市场概况

乌镇智库

11+阅读 · 2019年7月27日

形式化方法的研究进展与趋势

形式化方法的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月8日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

论智

12+阅读 · 2018年1月5日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

【知识图谱】大规模知识图谱的构建、推理及应用

【知识图谱】大规模知识图谱的构建、推理及应用

产业智能官

38+阅读 · 2017年9月12日

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

MBD环境下复杂产品信息网络的演化机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

准确大气辐射传输下的水体辐射传输研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

人类反馈强化学习 (RLHF)

相关VIP内容

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

专知会员服务

59+阅读 · 2023年10月19日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

77+阅读 · 2023年10月6日

基于UNet的医学图像分割综述

基于UNet的医学图像分割综述

专知会员服务

38+阅读 · 2023年8月8日

超大预训练模型在指挥控制领域的应用与挑战

超大预训练模型在指挥控制领域的应用与挑战

专知会员服务

95+阅读 · 2023年5月26日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

217+阅读 · 2023年5月9日

深度学习在光声成像中的应用综述

深度学习在光声成像中的应用综述

专知会员服务

27+阅读 · 2022年5月23日

人工神经网络模型发展及应用综述

专知会员服务

42+阅读 · 2021年6月2日

AI芯片发展现状及前景分析

专知会员服务

66+阅读 · 2021年5月2日

工业人工智能的关键技术及其在预测性维护中的应用现状

工业人工智能的关键技术及其在预测性维护中的应用现状

专知会员服务

92+阅读 · 2020年11月4日

基于几何深度学习的知识图谱关键技术研究进展

专知会员服务

131+阅读 · 2020年7月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

53+阅读 · 2022年4月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

3倍加速CPU上的BERT模型部署

3倍加速CPU上的BERT模型部署

ApacheMXNet

11+阅读 · 2020年7月13日

AIoT（一）丨产业的发展历程与市场概况

AIoT（一）丨产业的发展历程与市场概况

乌镇智库

11+阅读 · 2019年7月27日

形式化方法的研究进展与趋势

形式化方法的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月8日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

FAIR何恺明团队提出全景分割，开辟图像分割新方向（附论文）

论智

12+阅读 · 2018年1月5日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

【知识图谱】大规模知识图谱的构建、推理及应用

【知识图谱】大规模知识图谱的构建、推理及应用

产业智能官

38+阅读 · 2017年9月12日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

MBD环境下复杂产品信息网络的演化机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

准确大气辐射传输下的水体辐射传输研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员