自动问答(Question Answering, QA)是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务。不同于现有搜索引擎,问答系统是信息服务的一种高级形式,系统返回用户的不再是基于关键词匹配排序的文档列表,而是精准的自然语言答案。近年来,随着人工智能的飞速发展,自动问答已经成为倍受关注且发展前景广泛的研究方向。

知识荟萃

自动问答 Question Answering 专知荟萃

入门学习

  1. 自动问答系统的类别 冯志伟
  2. 基于深度学习的智能问答 周小强 陈清财 曾华军
  3. 基于知识图谱的电影自动问答系统(一)知识的获取与存储 (二)自动问答实现
  4. 客服系统机器人产品设计详解——智能回答
  5. 聊天机器人与自动问答技术
  6. 揭开知识库问答KB-QA的面纱
  7. Question answering with TensorFlow

综述

  1. 《Speeh and Language Processing》Chapter 28 Question Answering
  2. A Survey of Text Question Answering Techniques. Poonam Gupta,Vishal Gupta
  3. Question Answering Systems: Survey and Trends
  4. The Question Answering Systems: A Survey
  5. 面向知识自动化的自动问答研究进展
    [http://www.aas.net.cn/CN/10.16383/j.aas.2017.c160667]
  6. 自动问答综述 2002年 by 郑实福,刘挺,秦兵,李生 [http://jcip.cipsc.org.cn/CN/abstract/abstract1282.shtml]
  7. 基于 Web 的问答系统综述 2017 李舟军李水华 [http://www.jsjkx.com/jsjkx/ch/reader/create_pdf.aspx?file_no=20170601&flag=&journal_id=jsjkx&year_id=2017]

进阶文章

2009

  1. Question Generation via Overgenerating Transformations and Ranking (Technical report) - [https://www.lti.cs.cmu.edu/sites/default/files/cmulti09013.pdf]

2010

  1. Automation of question generation from sentences
  2. Good question!statistical ranking for question generation
  3. Question generation from paragraphs at upenn: Qgstec system description

2011

  1. Automatically generating questions from queries for community-based question answering
  2. How to Generate Cloze Questions from Definitions: A Syntactic Approach
    - [https://www.cs.cmu.edu/~listen/pdfs/gates-2011-aaai-qg.pdf]

2013

  1. Reasoning with Neural Tensor Networks
  2. Generating natural language questions to support learning on-line
    - [http://www.aclweb.org/anthology/W13-2114]

2014

  1. Question Answering with Subgraph Embeddings
  2. Open Question Answering with Weakly Supervised Embedding Models
    - [https://arxiv.org/pdf/1404.4326.pdf]
  3. Neural Machine Translation by jointly learning to align and translate
    - [https://arxiv.org/pdf/1409.0473v7.pdf]
  4. Neural Turing Machines
  5. Sequence to Sequence Learning With Neural Networks

2015

  1. Towards AI-Complete Question Answering: A set of prerequisite toy tasks
  2. Large Scale simple question answering with Memory Networks
    - [https://arxiv.org/pdf/1506.02075v1.pdf]
  3. Ask Me Anything: Dynamic Memory Networks for Natural Language Processinger
  4. Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base
  5. Teaching machines to read and comprehend
  6. Applying Deep Learning to answer selection: A study and an open task
    - [https://arxiv.org/pdf/1508.01585v2.pdf]
  7. Gated Graph Sequence Neural Networks
  8. Neural Conversation Model
  9. Deep questions without deep understanding
    - [http://www.aclweb.org/anthology/P15-1086]
  10. Leveraging multiple views of text for automatic question generation
  11. Leveraging multiple views of text for automatic question generation
  12. Revup: Automatic gap-fill question generation from educational texts
  13. Towards topic-to-question generatio

2016

  1. Key-Value Memory Networks for directly understanding documents
    - [https://arxiv.org/pdf/1606.03126v1.pdf]
  2. Value of Semantic Parse Labeling for KBQA
  3. Learning End-to-End Goal-Oriented dialog
  4. End-to-End Memory Networks with Knowledge Carryover for Multi-Turn Spoken Language Understanding
  5. Question Answering over Knowledge Base With Neural Attention Combining Global Knowledge Information
  6. Compositional Learning of Embeddings for Relation Paths in Knowledge Bases and Texts
  7. Recurrent Neural Network Grammar
  8. Hybrid computing using a neural network with dynamic external memory
  9. Gaussian Attention Model and its Application to Knowledge Base Embedding and Question Answering
  10. Query Reduction Networks For Question Answering
  11. Conditional Focused Neural Question Answering with Large-scale Knowledge Bases
  12. An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention Combining Global Knowledge
  13. Ranking automatically generated questions using common human queries
  14. Generating quiz questions from knowledge graphs
  15. Generating Factoid Questions With Recurrent Neural Networks: The 30M Factoid Question-Answer Corpus
  16. Knowledge Questions from Knowledge Graphs
  17. Question Generation from a Knowledge Base with Web Exploration
    - [https://arxiv.org/pdf/1610.03807.pdf]
  18. On Generating Characteristic-rich Question Sets for QA Evaluation
    - [http://www.aclweb.org/anthology/D/D16/D16-1054.pdf]

2017

  1. Efficiently Answering Technical Questions — A Knowledge Graph Approach
  2. Semi-supervised qa with generative domain-adaptive nets
  3. Machine Comprehension by Text-to-Text Neural Question Generation
    - [http://aclweb.org/anthology/W17-2603]
  4. Neural Question Generation from Text: A Preliminary Study

Tutorial

  1. Question Answering Become Main Theme of IR Research? 李航 今日头条
  2. 深度问答技术 中科院自动化所 赵军老师
  3. 深度学习与智能问答     CCL 2016 Tutorial 刘康 冯岩松
    1. 基于传统符号表示的知识库问答
    2. 基于深度学习的知识库问答
    3. 基于深度学习的对话系统
    4. 基于深度学习的阅读 解
  4. 基于知识的智能问答技术 冯岩松 2017. [http://cips-upload.bj.bcebos.com/2017/ssatt2017/ATT2017-QAI.pdf]
  5. 自动问答、聊天机器人与自然语言理解 中国计算机学会《学科前沿讲习班》 by 严睿 段楠 段楠 熊德意 高剑峰 谢幸 http://tcci.ccf.org.cn/conference/2017/adlnotice.php

视频教程

  1. 深度学习在自动问答系统中的应用 李成华

代码

  1. MemNN Impl Matlab
  2. Key Value MemNN
  3. Quepy
  4. NLQuery
  5. ParlAI
  6. flask-chatterbot
  7. Learning to Rank short text pairs with CNN SIGIR 2015
  8. TextKBQA
  9. BiAttnFlow

Datasets

  1. SQuAD The Stanford Question Answering Dataset
  2. CNN QA Task (Teaching Machines to Read & Comprehend)
  3. WebQuestions
  4. Simple Questions
  5. Movie QA
  6. WebQuestionsSP
  7. WikiQA
  8. Kaggle AllenAI Challenge
  9. MC Test, Machine Comprehension Test Microsoft 2013
  10. MSR Sentence Completion Challenge
  11. Dialog State Tracking Challenge
  12. QA dataset featured in Teaching Machines to Read and Comprehend
  13. WebNav
  14. Stanford Question Answering Dataset
  15. FB15K Knowledge Base
  16. WikiQA
  17. Quora Duplicate Questions Dataset
  18. Query Reformulator Dataset Jeopardy etc
  19. Quiz Bowl Questions
  20. WebQA-Chinese
  21. Chat corpus
  22. DeepMind Q&A Dataset - [http://cs.nyu.edu/~kcho/DMQA/]
  23. WebQuestions - [https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a/#]
  24. WebQA
  25. GraphQuestions

领域专家

  1. 周明 微软亚洲研究院副院长、国际计算语言学协会(ACL)候任主席。1999年,周明博士加入微软亚洲研究院,不久开始负责自然语言研究组。他带领团队进行了微软输入法、英库词典(必应词典)、中英翻译、微软中国文化系列(微软对联、微软字谜、微软绝句)等重要产品和项目的研发,并对微软Office、必应搜索、Windows等产品中的自然语言技术做出了重要贡献。近年来,周明博士领导研究团队与微软产品组合作开发了微软小冰(中国)、Rinna(日本)、Zo(美国)等聊天机器人系统。

  2. Jiwei Li (李纪为) 斯坦福大学博士毕业生,第一位仅用三年时间就获得了斯坦福大学计算机科学(CS)博士学位的人, 李纪为博士也是在最近三年世界所有人工智能研究者中,以第一作者发表的顶级会议文章数量高居第一位。

  3. 刘康博士,中科院自动化所模式识别国家重点实验室副研究员,中国中文信息学会青年工作委员会执行委员。研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文三十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),曾获KDD CUP 2011 Track2 全球亚军,COLING 2014最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2015 Google Focused Research Award等。       - 个人主页:http://www.nlpr.ia.ac.cn/cip/~liukang/index.html

  4.  冯岩松博士,北京大学计算机科学与技术研究所讲师。2011年毕业于英国爱丁堡大学,获得信息科学博士学位。主要研究方向包括自然语言处理、信息抽取以及机器学习在自然语言处理中的应用;已连续三年在面向结构化知识库的知识问答评测QALD-4, 5, 6中获得第一名;相关工作已发表在TPAMI、ACL、EMNLP等主流期刊与会议上。同时,作为项目负责人或课题骨干已承担多项国家自然科学基金及科技部863计划项目。分别在 2014 和 2015 年获得 IBM Faculty Award。       - 个人主页:https://sites.google.com/site/ysfeng/home 

  5. 严睿,北京大学研究员,前百度公司资深研发,华中师范大学与中央财经大学客座教授与校外导师。主持研发多个开放领域对话系统和服务类对话系统,发表高水平研究论文近50篇,担任多个学术会议(KDD, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(高级)程序委员会委员及审稿人。

  6. 段楠博士,微软亚洲研究院自然语言计算组主管研究员,长期从事自动问答、对话系统、语义理解、文本生成和网络搜索等自然语言处理研究。段楠博士的多项研究成果已经转化到微软重要人工智能产品中,例如必应搜索、微软小冰、Cortana语音助手等。自2015年起,段楠博士开始担任NLPCC开放领域中文自动问答评测的负责人。 [https://www.microsoft.com/en-us/research/people/nanduan/]

  7. 高剑峰是微软合伙人,微软Redmond总部人工智能部门的研究经理(Partner Research Manager)。他致力于深度学习在文本和图像处理方面的研发,领导机器阅读理解、问答、对话方面的研究和人工智能系统开发,以及微软新一代商务人工智能系统的研发。6. 谢幸博士于2001年7月加入微软亚洲研究院,现任社会计算组高级主任研究员,并任中国科技大学兼职博士生导师。他分别于1996年和2001年在中国科技大学获得计算机软件专业学士和博士学位。目前,他的团队在数据挖掘、社会计算和普适计算等领域展开创新性的研究。 [https://www.microsoft.com/en-us/research/people/jfgao/]

  8. 谢幸,微软亚洲研究院,任社会计算组高级主任研究员,并任中国科技大学兼职博士生导师。目前,他的团队在数据挖掘、社会计算和普适计算等领域展开创新性的研究。他是ACM、IEEE高级会员和计算机学会杰出会员,多次担任顶级国际会议程序委员会委员和领域主席等职位。 [https://www.microsoft.com/en-us/research/people/xingx/]

  9. Percy Liang 斯坦福大学计算机系助理教授、斯坦福人工智能实验室成员 [https://cs.stanford.edu/~pliang/]

  10. 赵军 博导 中国科学院自动化研究所 http://people.ucas.ac.cn/~zhaojun

  11. 黄民烈 清华大学 http://www.tsinghua.edu.cn/publish/cs/4616/2013/20131122151220708543803/20131122151220708543803_.html


初步版本,水平有限,有错误或者不完善的地方,欢迎大家提建议和补充,会一直保持更新,本文为专知内容组原创内容,未经允许不得转载,如需转载请发送邮件至fangquanyi@gmail.com 或 联系微信专知小助手(Rancho_Fang)

敬请关注http://www.zhuanzhi.ai 和关注专知公众号,获取第一手AI相关知识

微信扫码咨询专知VIP会员