项目名称: 面向网络异构信息源的问答资源挖掘

项目编号: No.61073127

项目类型: 面上项目

立项/批准年度: 2011

项目学科: 武器工业

项目作者: 刘秉权

作者单位: 哈尔滨工业大学

项目金额: 11万元

中文摘要: 项目旨在研究从异构的网络资源中自动地获取知识,并以问题-答案对的形式加以表现和利用的方法。项目的具体研究内容包括:问答语义相关性量化评价、网络社区结构化非文本特征的挖掘和应用、事实性问题的答案模板自动学习以及相关的问答知识检索系统构建等。项目通过采用Deep Learning的模型架构解决了以问答对为代表的短文本语义相关性量化的问题,其研究结论对于短文本信息挖掘研究具有普遍意义。项目对网络社区中的社会化信息在问答资源挖掘中的应用进行了较为深入的研究,研究表明合理的引入非文本特征对于问答信息的定位具有十分重要的作用。通过对网络半结构化和结构化知识的挖掘研究,本项目对事实性答案模板自动学习进行了初步的探索。此外,通过将理论研究成果与实际应用相结合,项目组开发了若干在线实用原型系统。本项目的实施为自动问答技术的进一步研究积累了一定的理论经验和语料资源,同时也为短文本信息处理研究的深入打下了基础。

中文关键词: 问答资源挖掘;异构信息源;问答语义相关性;非文本特征;事实性答案模板

英文摘要: This project aims to promote the research on mining the knowledge presented by the form of question-answer (QA) pairs from the heterogeneous web information source automatically. The detail research topics include semantic relevance quantifying for QA pairs, mining and utilizing of structural non-textual features in web communities, automatical learning of factoid answer templates, and the related knowledge retrieval system building. Introducing the Deep Learing model, the problem of semantic relevance quantification for QA pairs is partly solved, and the research conclusions on it is commonly meaningful to all the studies oriented to the short texts. This project has taken deep studies on the non-textual features, which indicates that they are able to make greate contributions to detecting the QA pairs in the web communities. By taking the research on the mining of the semi-structured and structured knowledge in the web, this project has presented the preliminary studies on the learning of factoid answer templates. In addition, according to the theoretical research results, some online prototype systems are also built and applied. The implementation of this project has accumulated large amounts of theoretical experience and corpora, and has laid the foundation for the deep research in the short-text information processing.

英文关键词: Question-answer resource mining; heterogeneous web information source; semantic relevance of QA pairs; non-textual features; fatoid answer template

成为VIP会员查看完整内容
1

相关内容

面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
CIKM2021 | 用于链接预测的主题感知异质图神经网络
专知会员服务
24+阅读 · 2021年11月3日
面向知识图谱的知识推理综述
专知会员服务
149+阅读 · 2021年11月1日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
专知会员服务
45+阅读 · 2020年11月13日
专知会员服务
195+阅读 · 2020年10月14日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
37+阅读 · 2020年4月26日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
KoPL: 面向知识的推理问答编程语言
学术头条
1+阅读 · 2021年11月10日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
【资源推荐】情感分析资源列表
专知
31+阅读 · 2019年3月20日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
【知识图谱】如何构建知识图谱
产业智能官
134+阅读 · 2017年9月19日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月18日
Table Enrichment System for Machine Learning
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
CIKM2021 | 用于链接预测的主题感知异质图神经网络
专知会员服务
24+阅读 · 2021年11月3日
面向知识图谱的知识推理综述
专知会员服务
149+阅读 · 2021年11月1日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
专知会员服务
45+阅读 · 2020年11月13日
专知会员服务
195+阅读 · 2020年10月14日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
37+阅读 · 2020年4月26日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关资讯
KoPL: 面向知识的推理问答编程语言
学术头条
1+阅读 · 2021年11月10日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
【资源推荐】情感分析资源列表
专知
31+阅读 · 2019年3月20日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
【知识图谱】如何构建知识图谱
产业智能官
134+阅读 · 2017年9月19日
相关基金
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员