来自:深度学习的知识小屋
2020语言与智能技术竞赛--已经缓缓落下了帷幕,在此次比赛中,主办方引入了事件抽取任务, 吸引了非常多的队伍加入比赛,而赛后各位参赛大佬也陆续分享出了自己的比赛方案,因此小编在这里做一小波的汇总~(期待更多的分享!!!!)
介绍方案之前先来看看此次事件抽取的任务具体是什么:
本次比赛事件抽取的具体任务为识别出句子中的事件类型,并标注出该事件对应的事件论元,例如时间、地点、人物等,如下例所示: 输入:
{
"text":"历经4小时51分钟的体力、意志力鏖战,北京时间9月9日上午纳达尔在亚瑟·阿什球场,以7比5、6比3、5比7、4比6和6比4击败赛会5号种子俄罗斯球员梅德韦杰夫,夺得了2019年美国网球公开赛男单冠军。",
"id":"6a10824fe9c7b2aa776aa7e3de35d45d"
}
输出:
官方baseline是基于PaddlePaddle完成的,具体是通过Pipelined的方法,即基于序列标注方法先进行事件检测(ed), 然后进行论元的识别来完成事件抽取。除了github的代码外,主办方还贴心地提供了AiStudio下的baseline演示系统:
AI Studio 基线系统示例
AI Studio 基线系统示例(基于PaddleHub)
这里介绍苏神的分享方案!苏神在自己的博客中对阅读理解、关系抽取和事件抽取都给出了自己的baseline(膜大佬!!!)。对于事件抽取,由于此次任务并不需要识别出事件触发词而是只需要识别出事件类型和事件论元,因此苏神将其建模为一个序列标注问题。具体的数据处理方式和基本模型,都可以在代码中找到: https://github.com/bojone/lic2020_baselines/blob/master/ee.py
总体来说,这一方法包括三个部分构成:
具体地,大家可以在知乎阅读邱震宇大佬的分享;
看到OneWaymyway的名字,你是否想起了微信群里大家熟悉的学习委员呢(●ˇ∀ˇ●)!
这里分享便是学习委员的比赛思路,他的做法是通过对PaddleHub版的baseline进行修改,基于先识别事件类型,再识别事件对应的论元的两段式方法进行事件抽取任务。具体地,大家可以在链接中了解他的做法。而学习委员在比赛中的积极乐观和超级努力认真的态度,也让小编深深瑞思拜!!!
和你在一起^_^也在CSDN上分享了自己的参赛经历总结,他的思路也是从baseline入手,逐步进行一些小的改进。大家有兴趣可以前往他的博客阅读嗷!
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。