2022年了,有人说信息抽取领域早已是诸神黄昏。然而即使这样,依然“内卷”不止。似乎这个卷成麻花的领域已经看不到希望?
但是不久前,这个沉寂之地忽然翻起了浪花,一篇发表在ACL2022上的工作,昭示着这个领域终于获得了里程碑式的突破。
用一个架构实现了对该领域诸多子任务的统一建模,就好像秦始皇终于实现了大一统,消除了各个诸侯国之间不互通的度量衡(不是)。
之所以说是里程碑式的突破,是因为这项工作,屠爆了学术界榜单,成为信息抽取领域学术层面的最新SOTA;并且是人人可傻瓜式使用的开源工具,这意味着在这个应用场景非常广泛的领域,它能够快速的大规模落地开花~
原本应为任务难度大,落地成本居高不下的信息抽取,在各个领域都有了史无前例的可能性。无论是实体抽取还是事件抽取,都可以做到简洁并且精准!简直好用到让人觉得有点梦幻了!
这不禁让人好奇,这个开源工具的背后是怎么做到的呢?
这个在ACL2022大放异彩的信息抽取技术UIE,联合增强语言模型ERNIE3.0,强强联合带来让人惊艳的效果!
9月28、29日,直播解读超强UIE。
扫码获取免费听课名额
回复2022获取最新论文、资料合集
拥有“十八般武艺”的UIE不仅具备超强的zero-shot开放域信息抽取能力,还身具小样本定制训练能力。所以哪怕它在某些场景中表现欠佳,只要人工标几个样本丢过去就能大幅提升效果。这个强大的Few-Shot能力是工具在大量长尾场景落地的最后一公里保障。
简单来说,UIE借鉴近年来火热的Prompt概念,将希望抽取的Schema信息转换成“线索词” (Schema-basedPrompt)作为模型输入的前缀(SSI),使得模型理论上能够适应不同领域和任务的Schema信息,并按需抽取出线索词指向的内容,生成结构化语言表述的抽取结果(SEL)从而实现开放域环境下的通用信息抽取。
经过UIE预训练后,模型的小样本学习能力得到了极大的提升,这便是UIE工具具备强大定制化能力,进而实现中长尾行业落地的关键。
对更多细节感兴趣的小伙伴,可以扫码预约UIE讲解直播哦~
扫码获取免费听课名额
回复2022获取最新论文、资料合集
讲师介绍⬇⬇
当然,对于NLPer来说,最关心的还是能够对做科研,写论文有什么帮助?
不论是继续读博还是为了后面优质的就业机会,甚至就算是毕业,也对论文水平和质量有要求。
而对于发论文,最核心的一点仍然是你的工作有没有作出贡献,有没有创新。
那么及时了解领域内最前沿的技术,了解最新的sota,对于激发出一个好的idea,至关重要。
9月28、29日,大牛带你精读前沿论文,掌握最新sota,为你的科研答疑解惑。
扫码获取免费听课名额
回复2022获取最新论文、资料合集
-END-