信息抽取技术是指从自然语言文本中抽取实体、属性、关系等信息,从而实现基于海量文本自动构建知识,是搭建复杂知识库系统的重要步骤。基于寿险业务特性,平安人寿 AI 团队主攻对话式机器人技术,对搭建高质量知识库具备极高要求。凭借丰富的技术积累和应用经验,团队在国际权威 NLP 大赛 SemEval-2020 中,以满分成绩夺得关系抽取赛道冠军。
该赛事任务数据集句子存在大量复杂句式,在实体的定义描述上存在多种关系,部分数据集还存在多重定义以及长距离的指代关系,这些都对准确识别提出了极高要求。团队综合运用联合训练框架、上下文实体定义位置捕获、数据增强等技术方案,大幅提升算法模型对专业概念名词和复杂句式的理解和处理能力,最终实现满分夺冠。
本次直播将围绕赛题方案做详细讲解并总结 NLP 算法竞赛常用技巧。
赛事简介:SemEval 由 ACL(国际计算语言学协会)主办,是全球范围影响力最强、规模最大、参赛人数最多的词汇与语义计算领域权威赛事,迄今已举办 14 届,历届吸引了卡内基梅隆大学、TCS Research、百度、美团、科大讯飞等国内外一流高校、顶级科研机构和知名企业参与。
直播信息
赛题介绍:任务目标及评测方法
任务分析:探索性数据分析与 Local CV 构建
模型构建:联合训练框架、EI BERT+实体纠正及大规模预训练模型融合方案
实验分析与 NLP 算法竞赛常用技巧总结
运用多任务参数共享,将不同损失函数和评价指标融合进行联合训练
提出 EI-BERT 模型及实体纠正方案结合上下文对实体信息与关系进行预测
总结 NLP 算法竞赛的常用技巧和建模方案
嘉宾介绍
直播地址 & 交流群
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「PW Live」,即可获取入群通道。
B 站直播间:
合作伙伴
· 关于平安人寿AI团队 ·
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。