预训练最新内容 - 专知

会员服务 ·

预训练

在搭建网络模型时，需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当参数训练到比较好的时候就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

CVPR 2023 | 可扩展的视频基础模型预训练范式：训练出首个十亿参数量视频自监督大模型

CVPR 2023 | 可扩展的视频基础模型预训练范式：训练出首个十亿参数量视频自监督大模型

PaperWeekly

0+阅读 · 2023年4月9日

【CVPR2023】Mask3D:通过学习掩码3D先验对2D视觉transformer进行预训练

【CVPR2023】Mask3D:通过学习掩码3D先验对2D视觉transformer进行预训练

专知

2+阅读 · 2023年4月9日

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

专知

5+阅读 · 2023年4月4日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

24+阅读 · 2023年4月4日

GENIUS: 根据草稿进行文本生成的预训练模型，可用于多种NLP任务的数据增强

GENIUS: 根据草稿进行文本生成的预训练模型，可用于多种NLP任务的数据增强

PaperWeekly

1+阅读 · 2022年11月29日

K400首次90%准确率！UniFormerV2开源：基于ViT的高效视频识别

K400首次90%准确率！UniFormerV2开源：基于ViT的高效视频识别

PaperWeekly

1+阅读 · 2022年11月25日

EMNLP 2022 | ClidSum: 跨语言对话摘要

EMNLP 2022 | ClidSum: 跨语言对话摘要

PaperWeekly

3+阅读 · 2022年11月25日

EMNLP 2022 | 校准预训练模型中的事实知识

EMNLP 2022 | 校准预训练模型中的事实知识

PaperWeekly

1+阅读 · 2022年11月22日

注意力机制作用被高估了？苹果等机构新研究：把注意力矩阵替换成常数矩阵后，性能差异不大

注意力机制作用被高估了？苹果等机构新研究：把注意力矩阵替换成常数矩阵后，性能差异不大

量子位

0+阅读 · 2022年11月19日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

微软T-ULRv6：引领基础模型向多语言“大一统”迈进

微软T-ULRv6：引领基础模型向多语言“大一统”迈进

微软研究院AI头条

1+阅读 · 2022年11月17日

微软亚洲研究院持续迭代BEiT，为通用基础模型的大一统发展奠定基础

微软亚洲研究院持续迭代BEiT，为通用基础模型的大一统发展奠定基础

微软研究院AI头条

0+阅读 · 2022年11月15日

EMNLP 2022 | 稠密检索新突破：华为提出掩码自编码预训练模型

EMNLP 2022 | 稠密检索新突破：华为提出掩码自编码预训练模型

PaperWeekly

1+阅读 · 2022年11月14日

系统回顾深度强化学习预训练，在线、离线等研究这一篇就够了

系统回顾深度强化学习预训练，在线、离线等研究这一篇就够了

机器之心

6+阅读 · 2022年11月13日

参考链接

微信扫码咨询专知VIP会员