最新SOTA!信息抽取终于实现了大一统

2022 年 9 月 27 日 PaperWeekly

2022年了,有人说信息抽取领域早已是诸神黄昏。然而即使这样依然“内卷”不止似乎这个卷成麻花的领域已经看不到希望

但是不久前这个沉寂之地忽然翻起了浪花一篇发表在ACL2022上的工作昭示着这个领域终于获得了里程碑式的突破

用一个架构实现了对该领域诸多子任务的统一建模就好像秦始皇终于实现了大一统消除了各个诸侯国之间不互通的度量衡不是)。

之所以说是里程碑式的突破是因为这项工作屠爆了学术界榜单,成为信息抽取领域学术层面的SOTA并且是人人可傻瓜式使用的开源工具这意味着在这个应用场景非常广泛的领域它能够快速的大规模落地开花~

原本应为任务难度大,落地成本居高不下的信息抽取在各个领域都有了史无前例的可能性无论是实体抽取还是事件抽取都可以做到简洁并且精准简直好用到让人觉得有点梦幻了

这不禁让人好奇,这个开源工具的背后是怎么做到的呢?

这个ACL2022大放异彩的信息抽取技术UIE联合增强语言模型ERNIE3.0强强联合带来让人惊艳的效果

92829直播解读超强UIE

扫码获取免费听课名额

回复2022获取最新论文资料合集

拥有“十八般武艺”的UIE不仅具备超强的zero-shot开放域信息抽取能力,还身具小样本定制训练能力。所以哪怕它在某些场景中表现欠佳,只要人工标几个样本丢过去能大幅提升效果。这个强大的Few-Shot能力是工具在大量长尾场景落地的最后一公里保障。

简单来说,UIE借鉴近年来火热的Prompt概念,将希望抽取的Schema信息转换成“线索词” (Schema-basedPrompt作为模型输入的前缀(SSI),使得模型理论上能够适应不同领域和任务的Schema信息,并按需抽取出线索词指向的内容,生成结构化语言表述的抽取结果(SEL)从而实现开放域环境下的通用信息抽取。

经过UIE预训练后,模型的小样本学习能力得到了极大的提升,这便是UIE工具具备强大定制化能力,进而实现中长尾行业落地的关键。

对更多细节感兴趣的小伙伴,可以扫码预约UIE讲解直播~

扫码获取免费听课名额

回复2022获取最新论文资料合集


讲师介绍⬇⬇

当然对于NLPer来说最关心的还是能够对做科研写论文有什么帮助

不论是继续读博还是为了后面优质的就业机会甚至就算是毕业也对论文水平和质量有要求

而对于发论文最核心的一点仍然是你的工作有没有作出贡献有没有创新

那么及时了解领域内最前沿的技术了解最新的sota对于激发出一个好的idea至关重要

92829大牛带你精读前沿论文掌握最新sota为你的科研答疑解惑

扫码获取免费听课名额

回复2022获取最新论文资料合集

-END-

登录查看更多
3

相关内容

知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。
AAAI 2022 | 基于预训练-微调框架的图像差异描述任务
专知会员服务
17+阅读 · 2022年2月26日
【AAAI 2022】用于文本摘要任务的序列级对比学习模型
专知会员服务
24+阅读 · 2022年1月11日
专知会员服务
86+阅读 · 2021年9月4日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
37+阅读 · 2021年4月9日
【AAAI2021】知识增强的视觉-语言预训练技术 ERNIE-ViL
专知会员服务
25+阅读 · 2021年1月29日
专知会员服务
193+阅读 · 2020年10月14日
【ICML2020】统一预训练伪掩码语言模型
专知会员服务
25+阅读 · 2020年7月23日
Seq2Seq+前缀树:检索任务新范式(以KgCLUE为例)
PaperWeekly
0+阅读 · 2021年12月20日
论文浅尝 | Multimodal Few-Shot Learning with Frozen Language Models
开放知识图谱
1+阅读 · 2021年9月23日
格局打开,带你解锁 prompt 的花式用法
夕小瑶的卖萌屋
5+阅读 · 2021年9月14日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
6+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
Arxiv
21+阅读 · 2019年8月21日
Arxiv
21+阅读 · 2019年3月25日
VIP会员
相关VIP内容
AAAI 2022 | 基于预训练-微调框架的图像差异描述任务
专知会员服务
17+阅读 · 2022年2月26日
【AAAI 2022】用于文本摘要任务的序列级对比学习模型
专知会员服务
24+阅读 · 2022年1月11日
专知会员服务
86+阅读 · 2021年9月4日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
37+阅读 · 2021年4月9日
【AAAI2021】知识增强的视觉-语言预训练技术 ERNIE-ViL
专知会员服务
25+阅读 · 2021年1月29日
专知会员服务
193+阅读 · 2020年10月14日
【ICML2020】统一预训练伪掩码语言模型
专知会员服务
25+阅读 · 2020年7月23日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
6+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员