超越快手腾讯！度小满NLP模型登顶CLUE榜首

会员服务 ·

超越快手腾讯！度小满NLP模型登顶CLUE榜首

2021 年 12 月 17 日 新智元

新智元报道

编辑：桃子好困

【新智元导读】要说自然语言处理最厉害的兵器，非「轩辕」剑莫属。近日，度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型刷榜CLUE，距离人类「表现」仅差3.38分！

自然语言处理是人工智能皇冠上的明珠，近日，度小满金融AI-Lab让人类摘得明珠的步伐又前进了一步。

据中文语言理解领域的权威测评基准官网公布，度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型在CLUE1.1分类任务中「力压群雄」获得了排名第一的好成绩。距离人类「表现」仅差3.38分！

CLUE是中文语言理解领域最具权威性的测评基准之一，涵盖了文本相似度、分类、阅读理解共10项语义分析和理解类子任务。

其中，分类任务需要解决6个问题，例如传统图像分类，文本匹配，关键词分类等等，能够全方面衡量模型性能。

该榜单竞争激烈，几乎是业内兵家必争之地，例如快手搜索、优图实验室 & 腾讯云等等研究机构也都提交了比赛方案。

据悉，位居榜首的「轩辕」是基于Transformer架构的预训练语言模型，涵盖了金融、新闻、百科、网页等多领域大规模数据。因此，该模型「内含」的数据更全面，更丰富，面向的领域更加广泛。

传统预训练模型采取「训练-反馈」模式，度小满金融AI-Lab在训练「轩辕」的时候细化了这一过程，引入了任务相关的数据，融合不同粒度不同层级的交互信息，从而改进了传统训练模式。

模型设计思路有两点：

1.宏观角度，先从通用大规模的数据逐渐迁移到小规模的特定业务以及特定任务，然后去通过不同的阶段逐渐训练，直到满足目标任务。

2.微观角度，针对不同的下游分类任务，会相应的设计出定制化的分类模型。然后采用自监督学习、迁移学习等等提升模型的性能。

目前，「轩辕」还处于1.0的版本，更侧重于自然语言理解能力，在接下来的2.0版本中，研发人员会采用更大规模的数据，训练出更加通用的预训练模型，从而赋能更多的业务和领域。

度小满为何「看中」预训练模型？

预训练模型是一种迁移学习的应用，可以利用几乎无限的文本，学习输入句子的每一个成员的上下文相关的表示，它隐式地学习到了通用的语法语义知识。

换句话说，预训练模型把通用人类的语言知识先学会，然后再代入到某个具体任务。它可以将从开放领域学到的知识迁移到下游任务，以改善低资源任务；还可以使自然语言处理由原来的手工调参、依靠ML专家的阶段，进入到可以大规模、可复制的大工业施展的阶段。

不止是融合人类知识，预训练模型的「改善」、「大规模」、「可复制」等关键词背后意味着降成本、提效率。这和度小满金融CEO朱光「用科技服务小微企业是金融科技公司的价值和使命」的理念不谋而合。

今年5月21日，在度小满金融成立三周年之际，度小满金融CEO朱光表示，「未来三年，度小满将继续加大人工智能技术的研发投入，聚焦小微客户，持续降低小微企业主的整体融资成本，为3000万小微企业主提供值得信赖的综合金融服务。」

目前，除了预训练，度小满金融AI-Lab在文本分类、信息抽取和技术资源等方向亦有布局。在战略上会有两点侧重：首先加强自身的数据生态建设，合法合规使用用户数据，解决数据孤岛；其次通过产学研相结合，布局前沿技术，落地金融场景业务。

目前，度小满与北京大学光华管理学院成立了「金融科技联合实验室」，和西安交大成立了「西安交通大学-度小满金融人工智能联合研究中心」，并与中国科学院自动化研究所共建博士后工作站，共同开展人工智能及相关领域的博士后联合招收培养。

度小满研发人员一直相信人工智能技术势必会变革金融领域的已有研究范式。因此，连接理论前沿研究与业界的技术应用研究，推动人工智能技术在金融产业中发挥更大价值，会是度小满一直的追求。

登录查看更多

相关内容

CLUE

关注 0

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

专知会员服务

42+阅读 · 2021年3月3日

小米在预训练模型的探索与优化

专知会员服务

20+阅读 · 2020年12月31日

【AAAI2021】LRC-BERT：对比学习潜在语义知识蒸馏的自然语言理解

专知会员服务

27+阅读 · 2020年12月31日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

【复旦大学刘鹏飞博士论文】自然语言处理中的神经表示学习，153页pdf

专知会员服务

107+阅读 · 2020年9月1日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知会员服务

25+阅读 · 2020年4月20日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

AI十级「找茬」选手，非这个书生莫属，节后开源！

THU数据派

0+阅读 · 2022年1月21日

2600亿参数，60多项任务突破，全球最大中文单体模型鹏城-百度·文心发布

机器之心

0+阅读 · 2021年12月8日

百度黄正杰：知识增强图语义理解技术

专知

2+阅读 · 2021年12月6日

专心做搜索也能登顶CLUE分类榜？在快手做搜索是一种怎样的体验

夕小瑶的卖萌屋

0+阅读 · 2021年11月8日

NLP界新SOTA！吸纳5000万级知识图谱，一举刷爆54个中文任务！

夕小瑶的卖萌屋

0+阅读 · 2021年7月8日

千亿参数大模型时代，QQ浏览器团队十亿级小模型「摩天」登顶CLUE，极致压榨网络性能

机器之心

0+阅读 · 2021年6月24日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE（附项目地址）

数据派THU

24+阅读 · 2019年3月23日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE

机器之心

11+阅读 · 2019年3月16日

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

AI100

33+阅读 · 2019年3月16日

汉英篇章衔接对齐资源构建与分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

即时通讯匿名隐通道系统模型与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

文本分类中的文本图表示模型和结构化稀疏模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于参数的迁移学习分析、建模与应用

国家自然科学基金

6+阅读 · 2014年12月31日

苯并异噻唑酮类caspase-3抑制剂结构优化与生物活性评价

国家自然科学基金

0+阅读 · 2013年12月31日

钙钛矿型5d过渡金属氧化物电荷、自旋和轨道耦合的第一性原理研究

国家自然科学基金

0+阅读 · 2012年12月31日

本体导向的大规模语义信息声明式抽取方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于生成树库分析与生成一体化机器翻译模型研究

国家自然科学基金

0+阅读 · 2009年12月31日

LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking

Arxiv

0+阅读 · 2022年4月19日

CodexDB: Generating Code for Processing SQL Queries using GPT-3 Codex

Arxiv

2+阅读 · 2022年4月19日

XLM-E: Cross-lingual Language Model Pre-training via ELECTRA

Arxiv

0+阅读 · 2022年4月19日

WuDaoMM: A large-scale Multi-Modal Dataset for Pre-training models

Arxiv

0+阅读 · 2022年4月19日

Pre-Training on Dynamic Graph Neural Networks

Arxiv

1+阅读 · 2022年4月18日

Data-Free Knowledge Transfer: A Survey

Arxiv

21+阅读 · 2021年12月31日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

VIP会员