Transformer:理论架构创新   自注意力机制:支持并行计算/全局上下文的理解能力   多头注意力:从多个角度捕捉复杂的语义关系   前馈网络/位置编码/层归一化:解决了传统模型的诸多局限性   预训练时代:大力出奇迹(“暴力美学”)   BERT:Bidirectional Encoder Representations Transformers   GPT: Generative Pertained Transformer   自监督算法:MLM/NTP/MAE解决海量数据标注问题  

成为VIP会员查看完整内容
13

相关内容

深度求索(DeepSeek),全称杭州深度求索人工智能基础技术研究有限公司,是中国的一家人工智能与大型语言模型公司。2025年1月10日,DeepSeek为iOS和安卓系统发布其首款免费的基于DeepSeek-R1模型聊天机器人程序。截止到27日,DeepSeek-R1超过ChatGPT成为美区iOS应用商店免费应用程序榜首[3],并导致英伟达股价大跌18%[4][5]。DeepSeek成功挑战实力更强、更为著名的竞品从而被认为是颠覆人工智能[6]、打响了全球人工智能领域竞赛的第一枪[7]、引领人工智能下边缘政策新纪元
DS系列专题:DeepSeek技术溯源及前沿探索,50页ppt
专知会员服务
48+阅读 · 3月26日
DeepSeek模型关键创新技术综述
专知会员服务
44+阅读 · 3月21日
从DeepSeek看国产AI的“后发优势”
专知会员服务
28+阅读 · 2月28日
多智能体深度强化学习研究进展
专知会员服务
68+阅读 · 2024年7月17日
Transformer的无限之路:位置编码视角下的长度外推综述
专知会员服务
44+阅读 · 2024年1月17日
ICLR'24 大语言模型智能体最新研究进展
专知会员服务
94+阅读 · 2023年10月20日
ChatGPT 背后的“功臣”——RLHF 技术详解
专知会员服务
169+阅读 · 2023年2月21日
知识图谱最新研究综述
深度学习自然语言处理
45+阅读 · 2020年6月14日
多项NLP任务新SOTA,Facebook提出预训练模型BART
机器之心
22+阅读 · 2019年11月4日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
万字长文概述NLP中的深度学习技术
全球人工智能
12+阅读 · 2019年2月28日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
漫谈机器阅读理解之Facebook提出的DrQA系统
深度学习每日摘要
18+阅读 · 2017年11月19日
Word2Vec 与 GloVe 技术浅析与对比
LibRec智能推荐
25+阅读 · 2017年5月15日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
11+阅读 · 2022年9月1日
Arxiv
23+阅读 · 2022年2月4日
Arxiv
28+阅读 · 2021年10月1日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
10+阅读 · 2021年2月26日
Arxiv
15+阅读 · 2020年2月6日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
11+阅读 · 2018年7月31日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
VIP会员
相关VIP内容
DS系列专题:DeepSeek技术溯源及前沿探索,50页ppt
专知会员服务
48+阅读 · 3月26日
DeepSeek模型关键创新技术综述
专知会员服务
44+阅读 · 3月21日
从DeepSeek看国产AI的“后发优势”
专知会员服务
28+阅读 · 2月28日
多智能体深度强化学习研究进展
专知会员服务
68+阅读 · 2024年7月17日
Transformer的无限之路:位置编码视角下的长度外推综述
专知会员服务
44+阅读 · 2024年1月17日
ICLR'24 大语言模型智能体最新研究进展
专知会员服务
94+阅读 · 2023年10月20日
ChatGPT 背后的“功臣”——RLHF 技术详解
专知会员服务
169+阅读 · 2023年2月21日
相关资讯
知识图谱最新研究综述
深度学习自然语言处理
45+阅读 · 2020年6月14日
多项NLP任务新SOTA,Facebook提出预训练模型BART
机器之心
22+阅读 · 2019年11月4日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
万字长文概述NLP中的深度学习技术
全球人工智能
12+阅读 · 2019年2月28日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
漫谈机器阅读理解之Facebook提出的DrQA系统
深度学习每日摘要
18+阅读 · 2017年11月19日
Word2Vec 与 GloVe 技术浅析与对比
LibRec智能推荐
25+阅读 · 2017年5月15日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
相关论文
Arxiv
11+阅读 · 2022年9月1日
Arxiv
23+阅读 · 2022年2月4日
Arxiv
28+阅读 · 2021年10月1日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
10+阅读 · 2021年2月26日
Arxiv
15+阅读 · 2020年2月6日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
11+阅读 · 2018年7月31日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
微信扫码咨询专知VIP会员