IDEA研究院原作团队解读封神榜体系：致力于成为中文认知智能的基础设施 - 专知

会员服务 ·

0

IDEA研究院原作团队解读封神榜体系：致力于成为中文认知智能的基础设施

2022 年 9 月 10 日 机器之心

随着大模型在自然语言处理、计算机视觉等多个领域兴起，认知智能正在经历范式上的变化。借助大规模的数据以及庞大的参数量，这些模型展现出能够有效处理各种任务的特征，并正在以惊人的速度被部署到各个专业领域中，对社会和经济发展产生深远的影响。但是目前中文社区出现了某种停滞不前的现象，因为模型的体量已经从原本的百万参数飞跃至千亿级别，一些高校和传统公司并不具备足够的算力，也缺少有效的基础设施帮助他们训练和使用模型。因此，要推动人工智能技术进一步发展，坚实的基础设施尤为重要。

在这个背景下，IDEA 研究院正式宣布开启封神榜大模型开源计划，同时还提出封神框架和封神榜单。封神榜将全方面开源一系列预训练大模型，目前已覆盖文本理解、文本摘要、文本生成、多模态生成等相关任务，致力于为工业界和学术界提供简单高效的解决方案；封神框架则提供丰富、真实的源代码和示例用以模型训练及应用等；封神榜单提供一系列面向未来、易于应用、适用广泛的中文基准，以弥补目前中文基准的不足。未来，封神榜开源计划将持续更新，共建中文认知智能的基础设施。

目前封神榜已经取得的成绩包括：

预训练语言模型二郎神：UnifiedMC FewCLUE 榜单第一（2022.08.30）
预训练语言模型二郎神：UnifiedMC ZeroCLUE 榜单第一（2022.08.30）
多任务抽取方案 UBERT：AIWIN 大赛冠军（2022.07.21）
预训练语言模型二郎神：SimCLUE 榜单第一（2022.07.14）
预训练语言模型二郎神：ZeroCLUE 榜单第一（2022.01.24）
预训练语言模型二郎神：FewCLUE 榜单第一（2021.11.11）

分享主题：封神榜开源大模型体系：致力于成为中文认知智能的基础设施

分享嘉宾：王军杰，IDEA 研究院封神榜团队成员，现就读于早稻田大学攻读博士学位，清华大学客座学生（指导老师：杨余久）。

分享摘要：

封神榜开源大模型体系包括封神榜大模型、封神框架、封神榜单三个子项目，三者共同助力下一代 AI 基础设施建设，为研究者和开发者提供全方位的支持。目前封神榜大模型中的二郎神系列已经获得数个中文榜单 SOTA 成绩。

相关链接：

IDEA 研究院官网：

https://www.idea.edu.cn/

封神榜大模型开源计划：

https://www.idea.edu.cn/fengshenbang-lm.html

封神榜模型：

https://huggingface.co/IDEA-CCNL

封神框架：

https://github.com/IDEA-CCNL/Fengshenbang-LM

加群看直播

直播间 ：关注机器之心机动组视频号，北京时间 9 月 13 日 19:00 开播。

交流群： 本次直播设有 QA 环节，欢迎加入本次直播交流群探讨交流。

如群已超出人数限制，请添加机器之心小助手：syncedai2、syncedai3、syncedai4 或 syncedai5，备注「封神榜」即可加入。

如果你也有最新工作希望分享或提交你感兴趣的内容方向，随时告诉我们吧： https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。

登录查看更多

0

相关内容

认知智能

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

专知会员服务

18+阅读 · 2022年2月26日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

专知会员服务

36+阅读 · 2021年11月11日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

时空人工智能赋能数字孪生城市白皮书（2021），29页pdf

时空人工智能赋能数字孪生城市白皮书（2021），29页pdf

专知会员服务

86+阅读 · 2021年7月15日

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

专知会员服务

42+阅读 · 2021年3月3日

TensorFlow开发者峰会2020 Keynote，TF2及其庞大的科研、工业生态圈

TensorFlow开发者峰会2020 Keynote，TF2及其庞大的科研、工业生态圈

专知会员服务

26+阅读 · 2020年3月20日

【陆奇】数字化浪潮与创新机会，43页ppt，陆奇奇绩创坛创始人、首席执行官

【陆奇】数字化浪潮与创新机会，43页ppt，陆奇奇绩创坛创始人、首席执行官

专知会员服务

30+阅读 · 2020年1月12日

【2019 北京智源大会】预训练语言模型的研究与应用刘群/华为诺亚方舟实验室

【2019 北京智源大会】预训练语言模型的研究与应用刘群/华为诺亚方舟实验室

专知会员服务

31+阅读 · 2019年11月1日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

47+阅读 · 2019年10月25日

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

机器之心

3+阅读 · 2022年11月9日

首个中文Stable Diffusion模型开源，IDEA研究院封神榜团队开启中文AI艺术时代

首个中文Stable Diffusion模型开源，IDEA研究院封神榜团队开启中文AI艺术时代

机器之心

2+阅读 · 2022年11月2日

打破不可能三角、比肩5400亿模型，IDEA封神榜团队仅2亿级模型达到零样本学习SOTA

打破不可能三角、比肩5400亿模型，IDEA封神榜团队仅2亿级模型达到零样本学习SOTA

机器之心

0+阅读 · 2022年10月25日

开源双语千亿预训练模型GLM-130B 项目原作解读

开源双语千亿预训练模型GLM-130B 项目原作解读

机器之心

0+阅读 · 2022年9月5日

北京内推 | 百度AIG视觉技术部招聘计算机视觉研究实习生

北京内推 | 百度AIG视觉技术部招聘计算机视觉研究实习生

PaperWeekly

0+阅读 · 2022年8月23日

北京内推 | 微软亚洲互联网工程院S+D团队招聘NLP算法实习生

北京内推 | 微软亚洲互联网工程院S+D团队招聘NLP算法实习生

PaperWeekly

0+阅读 · 2022年8月6日

阿里巴巴达摩院对话团队招聘研究实习生！

阿里巴巴达摩院对话团队招聘研究实习生！

夕小瑶的卖萌屋

1+阅读 · 2022年7月13日

从50亿图文中提取中文跨模态新基准Zero，奇虎360全新预训练框架超越多项SOTA

从50亿图文中提取中文跨模态新基准Zero，奇虎360全新预训练框架超越多项SOTA

PaperWeekly

0+阅读 · 2022年6月11日

北京内推 | 阿里达摩院对话智能团队招聘对话系统方向研究实习生

北京内推 | 阿里达摩院对话智能团队招聘对话系统方向研究实习生

PaperWeekly

0+阅读 · 2022年4月15日

中文世界又多一个评测语言大模型能力的基准CUGE，覆盖17种主流NLP任务

中文世界又多一个评测语言大模型能力的基准CUGE，覆盖17种主流NLP任务

机器之心

1+阅读 · 2021年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

大学生实习失度性研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于人工智能的矿山技术经济指标动态优化研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于时空电/磁场数据的交流架空线路电压/电流全息反演方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

高硫中低温下选择性还原NOx催化体系及原位机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

精细化科研管理信息系统研究

国家自然科学基金

1+阅读 · 2012年12月31日

产气荚膜梭菌β2毒素致病机理的研究

国家自然科学基金

0+阅读 · 2012年12月31日

科研团队动态演化规律研究

国家自然科学基金

2+阅读 · 2012年12月31日

互联网体系结构可演进性模型与通用地址标识支撑平台

国家自然科学基金

0+阅读 · 2011年12月31日

On designing light-weight object trackers through network pruning: Use CNNs or transformers?

Arxiv

0+阅读 · 2022年11月24日

META-GUI: Towards Multi-modal Conversational Agents on Mobile GUI

Arxiv

0+阅读 · 2022年11月24日

COCO-DR: Combating Distribution Shifts in Zero-Shot Dense Retrieval with Contrastive and Distributionally Robust Learning

Arxiv

0+阅读 · 2022年11月24日

CodeT: Code Generation with Generated Tests

Arxiv

0+阅读 · 2022年11月23日

A Teacher-student Framework for Unsupervised Speech Enhancement Using Noise Remixing Training and Two-stage Inference

Arxiv

0+阅读 · 2022年11月23日

Trust in Human-AI Interaction: Scoping Out Models, Measures, and Methods

Arxiv

22+阅读 · 2022年4月30日

An Introduction to Autoencoders

Arxiv

17+阅读 · 2022年1月11日

A Survey on Data Augmentation for Text Classification

A Survey on Data Augmentation for Text Classification

Arxiv

16+阅读 · 2021年7月7日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

VIP会员

相关主题

粤港澳大湾区数字经济研究院

预训练语言模型

相关VIP内容

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

专知会员服务

18+阅读 · 2022年2月26日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

专知会员服务

36+阅读 · 2021年11月11日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

时空人工智能赋能数字孪生城市白皮书（2021），29页pdf

时空人工智能赋能数字孪生城市白皮书（2021），29页pdf

专知会员服务

86+阅读 · 2021年7月15日

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

专知会员服务

42+阅读 · 2021年3月3日

TensorFlow开发者峰会2020 Keynote，TF2及其庞大的科研、工业生态圈

TensorFlow开发者峰会2020 Keynote，TF2及其庞大的科研、工业生态圈

专知会员服务

26+阅读 · 2020年3月20日

【陆奇】数字化浪潮与创新机会，43页ppt，陆奇奇绩创坛创始人、首席执行官

【陆奇】数字化浪潮与创新机会，43页ppt，陆奇奇绩创坛创始人、首席执行官

专知会员服务

30+阅读 · 2020年1月12日

【2019 北京智源大会】预训练语言模型的研究与应用刘群/华为诺亚方舟实验室

【2019 北京智源大会】预训练语言模型的研究与应用刘群/华为诺亚方舟实验室

专知会员服务

31+阅读 · 2019年11月1日

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

知识指导的自然语言处理 [微信模式识别中心林衍凯] CCKS ATT 16-2019

专知会员服务

47+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

机器之心

3+阅读 · 2022年11月9日

首个中文Stable Diffusion模型开源，IDEA研究院封神榜团队开启中文AI艺术时代

首个中文Stable Diffusion模型开源，IDEA研究院封神榜团队开启中文AI艺术时代

机器之心

2+阅读 · 2022年11月2日

打破不可能三角、比肩5400亿模型，IDEA封神榜团队仅2亿级模型达到零样本学习SOTA

打破不可能三角、比肩5400亿模型，IDEA封神榜团队仅2亿级模型达到零样本学习SOTA

机器之心

0+阅读 · 2022年10月25日

开源双语千亿预训练模型GLM-130B 项目原作解读

开源双语千亿预训练模型GLM-130B 项目原作解读

机器之心

0+阅读 · 2022年9月5日

北京内推 | 百度AIG视觉技术部招聘计算机视觉研究实习生

北京内推 | 百度AIG视觉技术部招聘计算机视觉研究实习生

PaperWeekly

0+阅读 · 2022年8月23日

北京内推 | 微软亚洲互联网工程院S+D团队招聘NLP算法实习生

北京内推 | 微软亚洲互联网工程院S+D团队招聘NLP算法实习生

PaperWeekly

0+阅读 · 2022年8月6日

阿里巴巴达摩院对话团队招聘研究实习生！

阿里巴巴达摩院对话团队招聘研究实习生！

夕小瑶的卖萌屋

1+阅读 · 2022年7月13日

从50亿图文中提取中文跨模态新基准Zero，奇虎360全新预训练框架超越多项SOTA

从50亿图文中提取中文跨模态新基准Zero，奇虎360全新预训练框架超越多项SOTA

PaperWeekly

0+阅读 · 2022年6月11日

北京内推 | 阿里达摩院对话智能团队招聘对话系统方向研究实习生

北京内推 | 阿里达摩院对话智能团队招聘对话系统方向研究实习生

PaperWeekly

0+阅读 · 2022年4月15日

中文世界又多一个评测语言大模型能力的基准CUGE，覆盖17种主流NLP任务

中文世界又多一个评测语言大模型能力的基准CUGE，覆盖17种主流NLP任务

机器之心

1+阅读 · 2021年12月31日

相关基金

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

大学生实习失度性研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于人工智能的矿山技术经济指标动态优化研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于时空电/磁场数据的交流架空线路电压/电流全息反演方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

高硫中低温下选择性还原NOx催化体系及原位机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

精细化科研管理信息系统研究

国家自然科学基金

1+阅读 · 2012年12月31日

产气荚膜梭菌β2毒素致病机理的研究

国家自然科学基金

0+阅读 · 2012年12月31日

科研团队动态演化规律研究

国家自然科学基金

2+阅读 · 2012年12月31日

互联网体系结构可演进性模型与通用地址标识支撑平台

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

On designing light-weight object trackers through network pruning: Use CNNs or transformers?

Arxiv

0+阅读 · 2022年11月24日

META-GUI: Towards Multi-modal Conversational Agents on Mobile GUI

Arxiv

0+阅读 · 2022年11月24日

COCO-DR: Combating Distribution Shifts in Zero-Shot Dense Retrieval with Contrastive and Distributionally Robust Learning

Arxiv

0+阅读 · 2022年11月24日

CodeT: Code Generation with Generated Tests

Arxiv

0+阅读 · 2022年11月23日

A Teacher-student Framework for Unsupervised Speech Enhancement Using Noise Remixing Training and Two-stage Inference

Arxiv

0+阅读 · 2022年11月23日

Trust in Human-AI Interaction: Scoping Out Models, Measures, and Methods

Arxiv

22+阅读 · 2022年4月30日

An Introduction to Autoencoders

Arxiv

17+阅读 · 2022年1月11日

A Survey on Data Augmentation for Text Classification

A Survey on Data Augmentation for Text Classification

Arxiv

16+阅读 · 2021年7月7日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

大家都在搜

大型语言模型

CMU博士论文

软件无线电

国防科技创新

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员