项目名称: 面向社区的协同检索方法研究

项目编号: No.61202286

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 刘永利

作者单位: 河南理工大学

项目金额: 23万元

中文摘要: 随着社会化网络的飞速发展,协同检索成为信息检索领域的研究热点,它对于提高社区内用户检索的准确率和效率具有重要的实际意义。社区不断变化,因此需要对社区信息持续更新,但检索过程的特点为此造成了很大困难,包括:①数据稀疏;②特征空间维度高;③数据更新频繁。本课题围绕以上三个特点展开研究,内容包括:⑴三维空间相关性模型:建立由用户、查询和文档构成的三维空间,并采用概率方法量化三个维度间的相关性;⑵基于联合聚类的社区动态确定方法:针对检索过程的特点①和②,将原本仅用于分析二维列联表的信息论联合聚类方法进行扩展,使之适用于分析三维问题,进而动态确定用户社区;⑶增量学习机制:针对检索过程的特点③,从数据所在维入手,增量更新三维概率关系及联合聚类结果。本课题基于三维空间的概率关系,重点围绕社区的动态更新问题,兼顾理论分析和实践验证,为协同检索方法的进一步研究与应用提供新的思路。

中文关键词: 信息瓶颈;信息检索;模糊聚类;联合聚类;增量聚类

英文摘要: With the rapid development of social network, collaborative retrieval has become a research focus in Information Retrieval field, which has important practical significance to raising the accuracy and efficiency of Web search in communities. A community is constantly changing, which makes it obligatory to identify communities in dynamic networks, but such characteristics of search process will become bottlenecks, as ①sparsity, ②high-dimensionality and ③dynamic data. This topic mainly includes following three parts. ⑴Probability methods are employed to express the relevance amongst user, query and document. ⑵When dealing sparse and high-dimensional data, we innovatively extend information-theoretic co-clustering methods originally just used to analyze two-dimensional contingency tables to be is suitable for three-dimensional data. ⑶For dynamic data, we start with the dimensionality that needs to be updated, and incrementally renew the three-dimensional relevance and co-clustering results, as can improve the update efficiency. We also analyze and discuss the recommendation method based on collaboration and real-time property. Our topic is based on probabilistic relevance of the three-dimensional space, focuses on identifying communities dynamically, takes into account both theoretical analysis and experimental ver

英文关键词: information bottleneck;information retrieval;fuzzy clustering;co-clustering;incremental clustering

成为VIP会员查看完整内容
0

相关内容

面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
146+阅读 · 2021年11月1日
专知会员服务
15+阅读 · 2021年8月25日
专知会员服务
34+阅读 · 2020年11月29日
专知会员服务
190+阅读 · 2020年10月14日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
DSSM双塔模型及其Pytorch实现
机器学习与推荐算法
6+阅读 · 2022年3月21日
个性化商品搜索相关研究梳理
机器学习与推荐算法
0+阅读 · 2022年2月17日
社区说 | 物联网设备中运行 TensorFlow
TensorFlow
0+阅读 · 2021年9月16日
社区说 | 从知识图谱到认知图谱
TensorFlow
0+阅读 · 2021年9月9日
基于虚拟现实环境的深度学习模型构建
MOOC
23+阅读 · 2019年9月28日
实验室论文被 ICDM 2019录用
inpluslab
24+阅读 · 2019年8月20日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
10+阅读 · 2021年11月10日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
13+阅读 · 2018年4月18日
小贴士
相关VIP内容
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
146+阅读 · 2021年11月1日
专知会员服务
15+阅读 · 2021年8月25日
专知会员服务
34+阅读 · 2020年11月29日
专知会员服务
190+阅读 · 2020年10月14日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
相关资讯
DSSM双塔模型及其Pytorch实现
机器学习与推荐算法
6+阅读 · 2022年3月21日
个性化商品搜索相关研究梳理
机器学习与推荐算法
0+阅读 · 2022年2月17日
社区说 | 物联网设备中运行 TensorFlow
TensorFlow
0+阅读 · 2021年9月16日
社区说 | 从知识图谱到认知图谱
TensorFlow
0+阅读 · 2021年9月9日
基于虚拟现实环境的深度学习模型构建
MOOC
23+阅读 · 2019年9月28日
实验室论文被 ICDM 2019录用
inpluslab
24+阅读 · 2019年8月20日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员