会员服务 ·

CCL2022 航旅纵横杯-面向领域问答的知识抽取评测

2022 年 6 月 30 日 夕小瑶的卖萌屋

赛事最新动态：6月5日开放报名、开放训练数据，报名进行中，奖励丰厚！

任务介绍

任务组织方：北京航空航天大学 & 中航信移动科技有限公司

任务地址：

Github地址：
https://github.com/BDBC-KG-NLP/CCL2022-DQAB
比赛报名地址：
https://aistudio.baidu.com/aistudio/competition/detail/313

针对民航出行领域中信息动态更新频繁、用户出行问答需求旺盛及大量文本数据使用价值较低等问题，探索基于阅读理解技术实现从民航相关网页的文本数据中精准抽取出的问题和答案对。

一方面有助于更好地组织管理民航领域常用知识，为用户提供更好的问询服务；另一方面也为基于阅读理解的问答对生成方法在其他领域的实践应用提供相关思路，探索垂直领域内的问答对构建范式。

子任务及评价标准

子任务一：篇章级答案检索

评价标准：
模型输出结果的TopN（N=1，3，5）包含正确篇章的准确率。

TopN的答案中包含正确篇章即可算该问句篇章答案检索正确。

子任务二：段落级答案抽取

评价标准：
模型输出结果的TopN（N=1，3，5）包含正确段落的准确率TopN的答案中包含正确段落即可算该问句对应段落抽取正确。

子任务三：细粒度文本答案抽取

评价标准：
单个完整答案分数：精确率=预测答案与正确答案公共长度/预测段落长度召回率= 预测答案与正确答案公共长度/标注段落长度 F1=2精确率召回率/（精确率+召回率）。

多答案分数：对于部分问句，会有多个完整的答案，每个完整答案由多个答案片段组成。这种情况下每个完整答案单独计算精确率、召回率以及F1，然后取所有答案的F1值作为单个问句的答案分数。总的得分等于所有问句的F1的平均值。

评测数据

本次数据主要来源于航旅纵横内部问答社区的样本，原始数据包含问题以及可回答该问题的文本，其中的评测答案均为人工标注结果。

为保障数据标注质量，标注过程中由算法研发人员与产品设计人员针对业务特性与算法需求设计数据标注方法，然后对参与数据标注的算法工程师、产品设计人员和相关硕博开展培训，后由该标注团队进行标注测试。

在此过程中，任务组织者对标注结果进行打分，及时调整标注标准并对标注人员重新培训之后开展标注标注校准，同时任务组织者抽烟每位标注人员的100条标注结果进行质量检查，对标注中问题进行及时校正，对于标注质量较低数据进行重新标注。

下面介绍数据具体内容：

此次数据中包含(问题，相关段落，段落中答案)训练数据信息。

本次数据共计5042条数据，其中80%数据（4033条数据）作为比赛数据发布（3529train+504valid），20%（1009条数据）作为比赛测试数据（不发布）。

奖项设置

本次比赛每个任务独立进行排名，并根据排名颁发奖项。此外设置三个子任务奖励：

1.子任务一：篇章级答案检索

第一名：5000元
第二名：3000元
第三名：2000元

2.子任务二：段落级答案抽取

第一名：10000元
第二名：5000元
第三名：3000元

3.子任务三：细粒度段落级答案抽取

第一名：20000元
第二名：7000元
第三名：5000元

同时将由中国中文信息学会为本次评测获奖队伍提供荣誉证书。

赛程安排

比赛交流QQ群：

后台回复关键词【入群】

加入卖萌屋NLP、CV、搜广推与求职讨论群

后台回复关键词【顶会】

获取ACL、CIKM等各大顶会论文集！

登录查看更多

相关内容

问答

关注 0

基于强化学习的知识图谱综述

专知会员服务

204+阅读 · 2022年8月20日

微信搜一搜中的智能问答技术

专知会员服务

40+阅读 · 2022年6月18日

基于预训练语言模型的文本生成研究综述

专知会员服务

82+阅读 · 2021年10月15日

面向数据可视化的自然语言接口: 综述论文

专知会员服务

20+阅读 · 2021年9月12日

知识图谱多跳问答推理研究进展、挑战与展望

专知会员服务

90+阅读 · 2021年6月13日

文本情感分析方法研究综述

专知会员服务

56+阅读 · 2021年4月20日

基于视觉和语言的跨媒体问答与推理研究综述

专知会员服务

32+阅读 · 2021年3月17日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

163+阅读 · 2020年3月11日

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

【报名开启】CCKS2022技术评测任务五“开放知识图谱问答”

开放知识图谱

1+阅读 · 2022年4月29日

论文浅尝 | emrKBQA: 一个面向临床医疗问答的KBQA数据集

开放知识图谱

1+阅读 · 2021年7月11日

[评测通知] 2021年全国知识图谱与语义计算大会评测任务发布

哈工大SCIR

2+阅读 · 2021年4月20日

大规模跨领域中文任务导向多轮对话数据集及模型CrossWOZ

AINLP

10+阅读 · 2020年4月16日

评测报名 | 全国知识图谱与语义计算大会(CCKS 2020)技术评测任务发布

开放知识图谱

144+阅读 · 2020年3月20日

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

报名 | 全国知识图谱与语义计算大会（CCKS 2019）评测任务发布

开放知识图谱

34+阅读 · 2019年3月19日

SMP2018中文人机对话技术评测

哈工大SCIR

12+阅读 · 2019年3月6日

基于知识图谱的问答系统入门—NLPCC2016KBQA数据集

PaperWeekly

70+阅读 · 2019年1月8日

2018机器阅读理解技术竞赛开始报名百度提供中文阅读理解数据集

机器学习研究会

10+阅读 · 2018年3月1日

面向云大数据信息聚合推导与控制技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向网络百科的知识抽取研究

国家自然科学基金

4+阅读 · 2014年12月31日

面向产品评论的评价对象层次结构分析与极性识别

国家自然科学基金

0+阅读 · 2013年12月31日

大数据环境下基于领域知识获取与对齐的观点检索研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本情绪分析中的关键问题研究

国家自然科学基金

3+阅读 · 2012年12月31日

面向文本信息安全的类别语义模型分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

自然语言处理中的覆盖域界定和聚焦点识别研究

国家自然科学基金

0+阅读 · 2012年12月31日

问答式信息检索中信息抽取技术研究

国家自然科学基金

3+阅读 · 2008年12月31日

基于双语文档反馈的跨语言信息检索研究

国家自然科学基金

0+阅读 · 2008年12月31日

Towards Boosting the Open-Domain Chatbot with Human Feedback

Arxiv

0+阅读 · 2022年8月30日

IMCI: Integrate Multi-view Contextual Information for Fact Extraction and Verification

Arxiv

0+阅读 · 2022年8月30日

Towards Code Summarization of APIs Using NLP Techniques

Arxiv

0+阅读 · 2022年8月26日

Adaptive Consistency Regularization for Semi-Supervised Transfer Learning

Arxiv

23+阅读 · 2021年3月3日

HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions

Arxiv

10+阅读 · 2020年12月31日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

Chinese NER Using Lattice LSTM

Arxiv

14+阅读 · 2018年5月15日

Contextual and Position-Aware Factorization Machines for Sentiment Classification

Arxiv

13+阅读 · 2018年1月18日

VIP会员