深度学习算法发展简述，从DNN到Transformer再到ChatGPT - 专知VIP

会员服务 ·

93

深度学习 · 神经网络 ·

2022 年 12 月 22 日

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

神经网络的发展以Relu激活函数的提出为分水岭，可分为浅层神经网络和深度学习两个阶段。浅层神经网络阶段最重要的任务是解决梯度不稳定的问题，在这个问题未被妥善解决之前，神经网络受限于激活函数梯度过大或过小、以及神经元全连接对高算力的要求，因此应用性能不佳，而属于非神经网络的支持向量机（SVM）是当时解决人工智能模式识别的主流方法。

　　过去10年，深度学习经历了从多样化发展到融合统一的阶段。深度学习时代的开启依托于2011年Relu激活函数被提出、梯度消失问题被大幅缓解，此后深度学习算法和应用的发展均突飞猛进。最初卷积神经网络（CNN）通过对高层次特征的提取和压缩，擅长图像分类等任务；循环神经网络（RNN）通过对时序信息的提取，擅长文字、语音识别和理解等任务。2017年Transformer的提出让深度学习进入了大模型时代、2020年VisionTransformer的提出让深度学习进入了多模态时代。由于Transformer在大数据并行计算方面具备优势，且训练数据增长后对模型精度提升明显，自此各模态和各任务底层算法被统一为Transformer架构。　　　深度学习底层算法发展放缓，数据无监督学习、数据生成以及高算力芯片成为行业发展的重点方向。目前深度学习算法主要是基于Transformer骨干网络来进行分支网络的创新。如OpenAI在多模态主干网络CLIP的基础上引入扩散模型，即训练出能完成语义图像生成和编辑的DALL〃E2，引发AIGC浪潮；在GPT-3模型基础上引入了人类反馈强化学习方法（RLHF），训练出InstructGPT模型，并据此发布了对话机器人ChatGPT，引起了互联网用户的注意。但随着Transformer基本完成底层算法统一之后，整个行业底层算法发展速度开始放缓，静待骨干网络的下一次突破。同时基于Transformer对大数据的需求，催生了无监督学习、高算力芯片的发展。　

成为VIP会员查看完整内容

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ChatGPT系列报告】AIGC & ChatGPT 发展报告，27页ppt

【ChatGPT系列报告】AIGC & ChatGPT 发展报告，27页ppt

专知会员服务

362+阅读 · 2023年2月18日

【ChatGPT系列报告】AIGC专题二：ChatGPT更懂人类的叙事

【ChatGPT系列报告】AIGC专题二：ChatGPT更懂人类的叙事

专知会员服务

175+阅读 · 2023年2月15日

AIGC的技术发展和应用：ChatGPT，20页pdf

AIGC的技术发展和应用：ChatGPT，20页pdf

专知会员服务

174+阅读 · 2023年2月13日

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

专知会员服务

186+阅读 · 2023年2月9日

生成对抗网络，10页pdf

生成对抗网络，10页pdf

专知会员服务

32+阅读 · 2022年11月23日

深度学习简史：从感知机到Transformer

深度学习简史：从感知机到Transformer

专知会员服务

102+阅读 · 2022年6月1日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

专知会员服务

85+阅读 · 2020年8月28日

【文本分类大综述：从浅层到深度学习，35页pdf】

【文本分类大综述：从浅层到深度学习，35页pdf】

专知会员服务

188+阅读 · 2020年8月6日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

196+阅读 · 2020年5月14日

深度学习简史：从感知机到Transformer

深度学习简史：从感知机到Transformer

专知

6+阅读 · 2022年6月1日

从感知机到Transformer，一文概述深度学习简史

从感知机到Transformer，一文概述深度学习简史

PaperWeekly

7+阅读 · 2022年5月31日

还在纠结CNN还是Transformer？清华发表一篇survey：全连接层才是终极答案！

还在纠结CNN还是Transformer？清华发表一篇survey：全连接层才是终极答案！

新智元

1+阅读 · 2021年11月24日

搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（十七）

搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（十七）

极市平台

1+阅读 · 2021年10月18日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

【深度学习】一文看尽深度学习各领域最新突破

【深度学习】一文看尽深度学习各领域最新突破

人工智能学家

42+阅读 · 2019年4月24日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

深度学习世界

33+阅读 · 2017年9月15日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能视频监控系统中目标理解的长时程深度学习模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构深度学习群的空间目标识别技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

融合稀疏表示与深度学习的图像分类技术研究

国家自然科学基金

7+阅读 · 2013年12月31日

原发性肝癌精确放疗致乙肝病毒再激活预测模型的建立

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

深度学习算法可重构加速器关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多任务概率视觉语义模型的图像场景理解

国家自然科学基金

2+阅读 · 2013年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Lightweight Real-time Semantic Segmentation Network with Efficient Transformer and CNN

Arxiv

0+阅读 · 2023年2月21日

Linguistic ambiguity analysis in ChatGPT

Arxiv

1+阅读 · 2023年2月20日

Efficiency 360: Efficient Vision Transformers

Arxiv

0+阅读 · 2023年2月17日

Efficient All-reduce for Distributed DNN Training in Optical Interconnect System

Arxiv

0+阅读 · 2023年2月17日

Diffusion Models in Vision: A Survey

Arxiv

29+阅读 · 2022年9月10日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

VIP会员

相关主题

相关VIP内容

【ChatGPT系列报告】AIGC & ChatGPT 发展报告，27页ppt

【ChatGPT系列报告】AIGC & ChatGPT 发展报告，27页ppt

专知会员服务

362+阅读 · 2023年2月18日

【ChatGPT系列报告】AIGC专题二：ChatGPT更懂人类的叙事

【ChatGPT系列报告】AIGC专题二：ChatGPT更懂人类的叙事

专知会员服务

175+阅读 · 2023年2月15日

AIGC的技术发展和应用：ChatGPT，20页pdf

AIGC的技术发展和应用：ChatGPT，20页pdf

专知会员服务

174+阅读 · 2023年2月13日

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

专知会员服务

186+阅读 · 2023年2月9日

生成对抗网络，10页pdf

生成对抗网络，10页pdf

专知会员服务

32+阅读 · 2022年11月23日

深度学习简史：从感知机到Transformer

深度学习简史：从感知机到Transformer

专知会员服务

102+阅读 · 2022年6月1日

人大最新《基于Transformer 的视频语言预训练》综述论文

人大最新《基于Transformer 的视频语言预训练》综述论文

专知会员服务

47+阅读 · 2021年9月27日

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

专知会员服务

85+阅读 · 2020年8月28日

【文本分类大综述：从浅层到深度学习，35页pdf】

【文本分类大综述：从浅层到深度学习，35页pdf】

专知会员服务

188+阅读 · 2020年8月6日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

196+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

深度学习简史：从感知机到Transformer

深度学习简史：从感知机到Transformer

专知

6+阅读 · 2022年6月1日

从感知机到Transformer，一文概述深度学习简史

从感知机到Transformer，一文概述深度学习简史

PaperWeekly

7+阅读 · 2022年5月31日

还在纠结CNN还是Transformer？清华发表一篇survey：全连接层才是终极答案！

还在纠结CNN还是Transformer？清华发表一篇survey：全连接层才是终极答案！

新智元

1+阅读 · 2021年11月24日

搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（十七）

搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（十七）

极市平台

1+阅读 · 2021年10月18日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

【深度学习】一文看尽深度学习各领域最新突破

【深度学习】一文看尽深度学习各领域最新突破

人工智能学家

42+阅读 · 2019年4月24日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

从0到1，这篇深度学习综述送给你！

从0到1，这篇深度学习综述送给你！

机器学习算法与Python学习

27+阅读 · 2018年6月13日

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

深度学习世界

33+阅读 · 2017年9月15日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能视频监控系统中目标理解的长时程深度学习模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构深度学习群的空间目标识别技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

融合稀疏表示与深度学习的图像分类技术研究

国家自然科学基金

7+阅读 · 2013年12月31日

原发性肝癌精确放疗致乙肝病毒再激活预测模型的建立

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的时序3D深度图动作语义理解

国家自然科学基金

2+阅读 · 2013年12月31日

深度学习算法可重构加速器关键技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多任务概率视觉语义模型的图像场景理解

国家自然科学基金

2+阅读 · 2013年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

相关论文

Lightweight Real-time Semantic Segmentation Network with Efficient Transformer and CNN

Arxiv

0+阅读 · 2023年2月21日

Linguistic ambiguity analysis in ChatGPT

Arxiv

1+阅读 · 2023年2月20日

Efficiency 360: Efficient Vision Transformers

Arxiv

0+阅读 · 2023年2月17日

Efficient All-reduce for Distributed DNN Training in Optical Interconnect System

Arxiv

0+阅读 · 2023年2月17日

Diffusion Models in Vision: A Survey

Arxiv

29+阅读 · 2022年9月10日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

微信扫码咨询专知VIP会员