语言是传递人类信息最重要的媒介,让机器理解语言并使用语言进行交互是实现通用人工智能的重要挑战。
为了攻克这个挑战,打赢这场无硝烟的 AI 战役,2020 年 3 月 10 日,一场面向开发者的「语言与智能技术竞赛」已正式启动。
这场竞赛,由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、CIPS 评测工作委员会和 CCF 中文信息技术专委会联合承办。
该竞赛共设立了五个任务,包括机器阅读理解、面向推荐的对话、语义解析、关系抽取和事件抽取。
针对五个比赛任务,组委会提供了
基于飞桨开源深度学习平台的基线系统,百度大脑 AI Studio 提供了软硬件环境支持,并为参赛团队额外提供了免费 GPU 算力支持。
每个竞赛任务分别评出一等奖 1 名,二等奖 1 名,三等奖 1 名和优胜奖 2 名。主办方将为获奖者提供荣誉证书,百度公司为参赛者提供奖金和参会旅行赞助。
为了让开发者在 test2 阶段取得优异成绩,组委会筹备了
两场
线上免费直播分享活动。
对于普通 NLP 开发者来说,这次技术直播也是个很不错的学习机会。
自然语言处理专题
知识图谱专题
开始时间:4 月 23 日(明晚)
直播分享
均由命题人亲临讲解,参赛选手可前往直播间参与弹幕互动。
对本次分享感兴趣的同学,扫描下方二维码添加小助手微信,回复「直播」进群:
专题分享详细内容
语义解析任务作为今年新增的热门题目,首次发布 DuSQL 数据集,包含 200 个数据库和近 2.4 万的问题,覆盖了匹配、计算等实际应用中常见问题形式,每个问题关联一个数据库中的 “一或多” 张表格。数据集更加符合真实应用场景,对模型的领域泛化、问题泛化、计算推理等能力提出了更高的挑战。分享嘉宾将从 Text-to-SQL 任务介绍及应用、DuSQL 数据集介绍、学术界主流方法及 DuSQL 基线介绍三方面作出解答。
相较去年,2020 年机器阅读理解任务焕新升级,重点关注阅读理解模型在真实应用场景中的鲁棒性。因此,分享嘉宾将结合机器阅读理解技术近年来的发展以及在实际应用中存在的问题,对 LIC-2020 阅读理解任务进行详细解答。
分享嘉宾将从面向推荐的对话任务设计思路展开分享。面向推荐的对话是指集成对话系统和推荐系统的人机交互系统。真实世界的人机交互会同时涉及到多种类型的对话,如何自然地融合多类型对话是一个高难度挑战。因此,参与此任务的选手绝对不能错过本次赛前分享。
本次竞赛在去年信息抽取任务的基础上进行了两处升级:一是在简单 SPO 关系的基础上增加了复杂关系类型,用来刻画现实世界中广泛存在的复杂关系;二是引入百度贴吧的口语化表达语料,文本语义自由度更高,更贴近日常口语的表达习惯。分享嘉宾将从关系抽取技术评测设置的背景、任务定义、评测数据集以及官方 baseline 原理等方面进行简要介绍。
事件抽取作为今年新增任务之一,备受学术界和工业界关注。通过给定目标事件类型和角色类型集合及句子,识别句子中所有目标事件类型的事件,并根据论元角色集合抽取事件所对应的论元。针对任务目标,分享嘉宾将对事件抽取技术评测设置的背景、任务定义、评测数据集以及官方 baseline 原理进行详解。
2020 语言与智能技术竞赛火热报名中,全部训练数据和第一批测试数据已于3月31日发放,报名截至5月20日。
今明两天晚 6 点半,干货满满的 B 站直播分享不容错过!
如何观看直播分享?
扫描长图中的二维码添加PaddlePaddle小助手微信,回复关键词「直播」进入微信交流群群,第一时间获取开播提醒和直播PPT。