2018机器阅读理解技术竞赛开始报名百度提供中文阅读理解数据集 - 专知

会员服务 ·

0

2018机器阅读理解技术竞赛开始报名百度提供中文阅读理解数据集

2018 年 3 月 1 日 机器学习研究会

3月1日，由百度公司、中国中文信息学会(CIPS)、中国计算机学会(CCF)联手举办的“2018机器阅读理解技术竞赛”正式开启报名通道。

本次竞赛，百度将提供面向真实应用场景迄今为止规模最大的中文阅读理解数据集DuReader。竞赛官网及报名通道已正式开启（http://mrc2018.cipsc.org.cn/），任何团队和个人都可以报名参加，获胜团队还将分享总额近10万人民币的奖金。

为什么举办本次竞赛？

阅读不仅是人类获取知识、提高心智的重要途径，对于机器而言，拥有阅读能力同样也能够实现持续学习和进化。机器阅读理解让机器阅读文本，然后回答和阅读内容相关的问题，其中涉及到的理解、推理、摘要等复杂技术，对机器而言颇具挑战。

该任务的研究对于智能搜索、智能推荐、智能交互等人工智能应用具有重要意义，是自然语言处理和人工智能领域的重要前沿课题。这也是百度联合举办2018机器阅读理解技术竞赛的重要原因。

百度将为参赛者提供

迄今为止规模最大的数据集

为了给予参赛者最大力度支持，本次竞赛将提供面向真实应用场景的大规模中文阅读理解数据集 DuReader，包含来自百度搜索的30万个真实问题，每个问题对应5个候选文档文本，以及人工撰写的优质答案。

同时，数据集还标注了问题类型、实体和观点等丰富信息。数据集将划分为28万的训练集，1万开发集和1万测试集。该数据集中包含了去年11月百度首批发布的 DuReader 数据集中的20万问题数据，参赛者可自由下载用于训练和测试。本次竞赛报名团队还将获得新增的10万问题数据集。

DuReader 是迄今为止最大的面向真实需求的中文阅读理解数据集，将为此次参赛的研究者提供有力支撑。

据悉，本次竞赛的任务是对于给定问题q及其对应的文本形式的候选文档集合D=d1, d2, ..., dn，要求参评阅读理解系统自动对问题及候选文档进行分析，输出能够满足问题的文本答案a。为了便于参赛选手快速了解竞赛任务，竞赛还提供了两个开源的阅读理解基线系统，并采用 ROUGH-L 和 BLEU 作为评价指标。

转自：百度AI

完整内容请点击“阅读原文”

登录查看更多

10

相关内容

机器阅读理解

机器阅读理解

包括微软、CMU、Stanford在内的顶级人工智能专家和学者们正在研究更复杂的任务：让机器像人类一样阅读文本，进而根据对该文本的理解来回答问题。这种阅读理解就像是让计算机来做我们高考英语的阅读理解题。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【中科院】命名实体识别技术综述

专知会员服务

157+阅读 · 2020年4月21日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

163+阅读 · 2020年3月11日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

【阿里技术干货】知识结构化在阿里小蜜中的应用

【阿里技术干货】知识结构化在阿里小蜜中的应用

专知会员服务

98+阅读 · 2019年12月14日

【CCL 2019】韩旭：知识表示与获取——博士生涯中的大体系与小合作

【CCL 2019】韩旭：知识表示与获取——博士生涯中的大体系与小合作

专知会员服务

41+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

65+阅读 · 2019年10月27日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

NLP基础任务:文本分类近年发展汇总,68页超详细解析

NLP基础任务:文本分类近年发展汇总,68页超详细解析

专知会员服务

74+阅读 · 2019年10月19日

中文知识图谱构建技术以及应用的综述

中文知识图谱构建技术以及应用的综述

专知会员服务

317+阅读 · 2019年10月19日

法研杯2019阅读理解赛道冠军方案分享（含PPT）

法研杯2019阅读理解赛道冠军方案分享（含PPT）

AINLP

67+阅读 · 2019年8月25日

第三届“讯飞杯”中文机器阅读理解评测报名开启（CMRC 2019）

第三届“讯飞杯”中文机器阅读理解评测报名开启（CMRC 2019）

哈工大SCIR

4+阅读 · 2019年5月27日

2019语言与智能技术竞赛报名开启

2019语言与智能技术竞赛报名开启

中国计算机学会

16+阅读 · 2019年2月26日

【开源】2018中文机器阅读理解竞赛第四名代码开源

【开源】2018中文机器阅读理解竞赛第四名代码开源

专知

55+阅读 · 2018年8月9日

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI研习社

12+阅读 · 2018年7月30日

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI科技评论

7+阅读 · 2018年7月29日

「2018 机器阅读理解技术竞赛」落下帷幕，看奇点机智如何从 800 多支队伍中杀出重围

「2018 机器阅读理解技术竞赛」落下帷幕，看奇点机智如何从 800 多支队伍中杀出重围

AI研习社

5+阅读 · 2018年5月28日

DuReader：百度大规模的中文机器阅读理解数据集

DuReader：百度大规模的中文机器阅读理解数据集

全球人工智能

7+阅读 · 2018年5月8日

AI 竞赛 | 2018 机器阅读理解技术竞赛

AI 竞赛 | 2018 机器阅读理解技术竞赛

AI研习社

7+阅读 · 2018年3月16日

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

机器之心

6+阅读 · 2018年2月22日

Adversarial NLI: A New Benchmark for Natural Language Understanding

Arxiv

4+阅读 · 2019年10月31日

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

5+阅读 · 2018年9月25日

Knowledge Based Machine Reading Comprehension

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

A Read-Write Memory Network for Movie Story Understanding

Arxiv

5+阅读 · 2018年3月16日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

VIP会员

相关主题

机器阅读理解

中国中文信息学会

中国计算机学会(CCF)

相关VIP内容

【中科院】命名实体识别技术综述

专知会员服务

157+阅读 · 2020年4月21日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知会员服务

163+阅读 · 2020年3月11日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

【阿里技术干货】知识结构化在阿里小蜜中的应用

【阿里技术干货】知识结构化在阿里小蜜中的应用

专知会员服务

98+阅读 · 2019年12月14日

【CCL 2019】韩旭：知识表示与获取——博士生涯中的大体系与小合作

【CCL 2019】韩旭：知识表示与获取——博士生涯中的大体系与小合作

专知会员服务

41+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

65+阅读 · 2019年10月27日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

NLP基础任务:文本分类近年发展汇总,68页超详细解析

NLP基础任务:文本分类近年发展汇总,68页超详细解析

专知会员服务

74+阅读 · 2019年10月19日

中文知识图谱构建技术以及应用的综述

中文知识图谱构建技术以及应用的综述

专知会员服务

317+阅读 · 2019年10月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

法研杯2019阅读理解赛道冠军方案分享（含PPT）

法研杯2019阅读理解赛道冠军方案分享（含PPT）

AINLP

67+阅读 · 2019年8月25日

第三届“讯飞杯”中文机器阅读理解评测报名开启（CMRC 2019）

第三届“讯飞杯”中文机器阅读理解评测报名开启（CMRC 2019）

哈工大SCIR

4+阅读 · 2019年5月27日

2019语言与智能技术竞赛报名开启

2019语言与智能技术竞赛报名开启

中国计算机学会

16+阅读 · 2019年2月26日

【开源】2018中文机器阅读理解竞赛第四名代码开源

【开源】2018中文机器阅读理解竞赛第四名代码开源

专知

55+阅读 · 2018年8月9日

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI研习社

12+阅读 · 2018年7月30日

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI科技评论

7+阅读 · 2018年7月29日

「2018 机器阅读理解技术竞赛」落下帷幕，看奇点机智如何从 800 多支队伍中杀出重围

「2018 机器阅读理解技术竞赛」落下帷幕，看奇点机智如何从 800 多支队伍中杀出重围

AI研习社

5+阅读 · 2018年5月28日

DuReader：百度大规模的中文机器阅读理解数据集

DuReader：百度大规模的中文机器阅读理解数据集

全球人工智能

7+阅读 · 2018年5月8日

AI 竞赛 | 2018 机器阅读理解技术竞赛

AI 竞赛 | 2018 机器阅读理解技术竞赛

AI研习社

7+阅读 · 2018年3月16日

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

机器之心

6+阅读 · 2018年2月22日

相关论文

Adversarial NLI: A New Benchmark for Natural Language Understanding

Arxiv

4+阅读 · 2019年10月31日

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

5+阅读 · 2018年9月25日

Knowledge Based Machine Reading Comprehension

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

End-to-end Speech Recognition with Word-based RNN Language Models

End-to-end Speech Recognition with Word-based RNN Language Models

Arxiv

3+阅读 · 2018年8月8日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

A Read-Write Memory Network for Movie Story Understanding

Arxiv

5+阅读 · 2018年3月16日

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Arxiv

7+阅读 · 2018年1月18日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员