项目名称: 基于查询词级联关系的高阶信息检索问题研究

项目编号: No.61202181

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 乔亚男

作者单位: 西安交通大学

项目金额: 25万元

中文摘要: 传统信息检索系统的输入通常是一系列平行的查询词,只能较为粗糙地反映用户的信息需求。在实际应用环境中,用户给出的多个查询词之间往往存在着一定的层次关系,用户实际需求的文档不仅要包含特定的查询词,而且这些查询词在文档中的相对位置还需要满足特定的多重从属关系,即满足查询词级联关系。这种基于查询词间级联关系的信息检索问题称之为高阶信息检索问题,它在一定程度上统一了已有的一些研究方向,如舆情分析、时间链分析、发展趋势分析和文本情感分类等。本课题试图建立统一模型对高阶信息检索问题进行建模和分析,挖掘查询词间的深层次关系,以更通用的方式解决高阶信息检索问题。在该模型中,文档和查询都被抽象为文档张量和查询张量,文档和查询的匹配过程转化为文档张量和查询张量之间的相似度运算,可以更直接地处理在传统信息检索模型中本质上被简化为一阶的高阶信息检索问题。

中文关键词: 信息检索;社会网络分析;维基百科;微博;新词识别

英文摘要: The inputs of traditional Information Retrieval systems are always query terms with parallel relations, and this type of inputs reflect the users' information needs roughly. In the practical applications, there are some complex relations between query terms frequently. In fact, not only should the documents user needed contain the query terms, but also the relative positions of query terms should meet certain hiberarchy relations. This is "Higher-order Information Retrieval" defined in this proposal, and we call traditional Information Retrieval "first order Information Retrieval" instead. Some research fields such as Public Opinion Analysis, Chain of Events Analysis, Trend Analysis and Text Sentiment Classification reflect the vague concept of Higher-order Information Retrieval in previous studies. In this proposal, we try to propose a unified model to deal with Higher-order Information Retrieval problems, mining the inner meanings between query terms, resolving the Higher-order Information Retrieval Problems in more general ways. In this unified model, the documents and queries are converted to document tensors and query tensors, and the matchings between documents and queries are converted to the calculations of similarity function between document tensors and query tensors. This unified model is appropriate

英文关键词: Information Retrieval;Society Network Service Analysis;Wikipedia;Microblog;New Word Detection

成为VIP会员查看完整内容
0

相关内容

信息检索( Information Retrieval )指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索的目标:准确、及时、全面的获取所需信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型
专知会员服务
24+阅读 · 2021年12月5日
【计算所&清华等新书】预训练方法信息检索,109页pdf
专知会员服务
64+阅读 · 2021年11月30日
专知会员服务
43+阅读 · 2021年10月20日
专知会员服务
56+阅读 · 2021年8月12日
专知会员服务
35+阅读 · 2020年11月29日
专知会员服务
45+阅读 · 2020年11月13日
【CIKM2020】学习表示解决可解释推荐系统
专知会员服务
47+阅读 · 2020年9月6日
专知会员服务
49+阅读 · 2020年8月27日
一文梳理推荐系统中的特征交互排序模型
RUC AI Box
1+阅读 · 2022年4月8日
基于知识图谱的推荐系统总结
机器学习与推荐算法
4+阅读 · 2021年11月11日
SIGIR 2021 | 推荐系统中的多行为建模
PaperWeekly
1+阅读 · 2021年10月9日
赛尔笔记 | 可解释的自然语言处理方法简介
哈工大SCIR
3+阅读 · 2021年5月28日
ACL 2019开源论文 | 基于Attention的知识图谱关系预测
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
7+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月18日
小贴士
相关VIP内容
NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型
专知会员服务
24+阅读 · 2021年12月5日
【计算所&清华等新书】预训练方法信息检索,109页pdf
专知会员服务
64+阅读 · 2021年11月30日
专知会员服务
43+阅读 · 2021年10月20日
专知会员服务
56+阅读 · 2021年8月12日
专知会员服务
35+阅读 · 2020年11月29日
专知会员服务
45+阅读 · 2020年11月13日
【CIKM2020】学习表示解决可解释推荐系统
专知会员服务
47+阅读 · 2020年9月6日
专知会员服务
49+阅读 · 2020年8月27日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
7+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员