10 月 13 日(周六)上午,PaperWeekly 携手清华大学计算机系推出了计算未来轻沙龙第二期线下活动——让机器拥有理解语言的能力。来自中国科学院自动化研究所、国防科技大学计算机学院和清华大学计算机系的三位博士,系统而深入地分享了他们各自在机器阅读理解领域的最新研究进展。
本文将独家分享本期活动的完整视频回顾和嘉宾课件下载。
王炳宁 / 中国科学院自动化研究所博士
王炳宁,中国科学院自动化研究所博士毕业生,主要研究方向为自然语言处理,机器阅读理解。在 IJCAI,ACL 等人工智能、自然语言处理顶级会议上以第一作者身份发表论文四篇。现负责搜狗立知项目阅读理解部分。
机器阅读理解研究进展概述
机器阅读理解是现今问答技术发展的核心之一。在本次报告中,我将从认知的角度介绍机器阅读理解的发展以及和人类阅读理解的关联和区别。
胡明昊 / 国防科技大学计算机学院博士生
胡明昊,博士在读,本科毕业于国防科技大学计算机学院,研究领域为自然语言处理和机器阅读理解。博士期间在 IJCAI、EMNLP 等国际顶尖学术会议上发表文章。
针对机器阅读理解的高效性和鲁棒性研究
近年来,抽取式机器阅读理解任务取得了显著的进展,最顶尖模型的性能甚至超过了人类。然而,当前方法却存在着效率低下、易受对抗样本攻击和无法拒绝给出答案等问题。在本报告中,我们将介绍如何利用知识蒸馏技术来提升阅读理解系统的效率和鲁棒性,并且讨论一个阅读+验证的框架来检测问题是否可回答。我们期望上述探索能够进一步增强阅读理解系统的实用性。
林衍凯 / 清华大学计算机系博士生
林衍凯,清华大学计算机系博士生五年级,来自清华大学自然语言处理组,由孙茂松教授和刘知远副教授共同指导,主要研究方向为知识图谱表示、构建和应用。目前已在人工智能、自然语言处理等领域的著名国际会议 IJCAI,AAAI,EMNLP,ACL 发表相关论文多篇,Google Scholar 引用数超过 700。
考虑噪音过滤的开放域问答
开放域问答着眼于从大规模的无标注文本中提取出给定问题的答案。现有开放域问答系统一般采用机器阅读理解技术对问题检索到的文本段落进行分析来提取出答案。但是,这些方法无法有效综合考虑不同文本段落的信息,还会受到文本段落中噪音的影响。此次报告,我们将介绍我们根据人类浏览、精读和总结的阅读模式提出的开放域问答模型,并介绍我们如何进一步利用有监督的数据帮助模型进行噪音过滤。
1 / 扫码关注
长按识别二维码,关注PaperWeekly
2 / 回复暗号
在PaperWeekly微信公众号后台
回复暗号181013
即可获取视频和嘉宾课件
#投 稿 通 道#
让你的论文被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢? 答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
📝 来稿标准:
• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)
• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接
• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志
📬 投稿邮箱:
• 投稿邮箱:hr@paperweekly.site
• 所有文章配图,请单独在附件中发送
• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 | 阅读原文 | 获取最新论文推荐