项目名称: 排序主题模型及其应用研究

项目编号: No.61272369

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 鲁明羽

作者单位: 大连海事大学

项目金额: 80万元

中文摘要: 主题模型是近年来兴起的可以从离散数据集中自动提取隐含语义结构的一种生成概率模型,是从海量数据中发现隐含语义主题的有效工具,可广泛应用于信息检索、自动文摘及推荐系统等领域。本项目遵循"小题精做"的原则,对一类重要的主题模型- - 排序主题模型进行深入研究,主要针对两种排序主题模型开展算法及其应用基础研究:第一种是查询无关的排序主题模型,通过度量词项之间的关系并结合主动学习方法,解决没有查询词情况下获得有序主题分布的问题;第二种是面向查询的排序主题模型,借鉴排序学习的思想,解决存在查询词情况下得到有序主题分布的问题。其次,本项目还将进行主题模型的参数推断方法研究,力求在提高推断精度的同时尽可能降低计算复杂度。最后,本项目拟将所提出的排序主题模型应用于多文本自动文摘和论文推荐系统中,研制开发两套应用系统,达到既验证算法又促进算法实用化的目的。

中文关键词: 机器学习;排序主题模型;多文档自动文摘;推荐系统;脑认知

英文摘要: Topic model is a kind of probabilistic model which can extract latent semantic structure from discrete data, and is effective to discover hidden meaningful topic from very large scale data. It can be applied widely in information retrieval, automatic summarization and recommender systems. Bearing the principle of focussing small topics, this project intents to research on one particular important topic model - - - ranking topic model. Two kinds of ranking topic models are proposed and to be applied in real-world applications: query-independent ranking topic models intent to get the ranked topic distributions without query words by evaluating relationships between terms and using active learning methods, and query-dependent ranking topic models intent to solve the problem of getting ranked topic distribution with query words by adopting learning-to-rank methods. Meanwhile, the project also intent to propose a new parametric inference method to enhance the model performance, which aims to reduce the computation complexity and raise the inference accuracy. At last, the project will apply the proposed ranking topic models to multi-document automatic summarization and academic paper recommender system. With two system established, the algorithms proposed in the project are evaluated and applied.

英文关键词: Machine Learning;Ranking Topic Model;Multi-document Automatic Summarization;Recommender System;Brain cognition

成为VIP会员查看完整内容
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
个性化学习推荐研究综述
专知会员服务
59+阅读 · 2022年2月2日
专知会员服务
16+阅读 · 2021年8月19日
专知会员服务
115+阅读 · 2021年8月8日
专知会员服务
7+阅读 · 2021年8月7日
专知会员服务
36+阅读 · 2021年6月16日
自动文本摘要研究综述
专知会员服务
68+阅读 · 2021年1月31日
专知会员服务
30+阅读 · 2020年9月13日
基于深度学习的多标签生成研究进展
专知会员服务
143+阅读 · 2020年4月25日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
Twitter情感分析及其可视化
数据挖掘入门与实战
22+阅读 · 2018年3月20日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
专栏 | 技术干货:一文详解LDA主题模型
机器之心
28+阅读 · 2017年12月1日
基于LDA的主题模型实践(三)
机器学习深度学习实战原创交流
23+阅读 · 2015年10月12日
基于LDA的主题模型实践(二 )MCMC--吉布斯采样
机器学习深度学习实战原创交流
25+阅读 · 2015年9月17日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Challenges for Open-domain Targeted Sentiment Analysis
小贴士
相关VIP内容
个性化学习推荐研究综述
专知会员服务
59+阅读 · 2022年2月2日
专知会员服务
16+阅读 · 2021年8月19日
专知会员服务
115+阅读 · 2021年8月8日
专知会员服务
7+阅读 · 2021年8月7日
专知会员服务
36+阅读 · 2021年6月16日
自动文本摘要研究综述
专知会员服务
68+阅读 · 2021年1月31日
专知会员服务
30+阅读 · 2020年9月13日
基于深度学习的多标签生成研究进展
专知会员服务
143+阅读 · 2020年4月25日
相关资讯
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
Twitter情感分析及其可视化
数据挖掘入门与实战
22+阅读 · 2018年3月20日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
专栏 | 技术干货:一文详解LDA主题模型
机器之心
28+阅读 · 2017年12月1日
基于LDA的主题模型实践(三)
机器学习深度学习实战原创交流
23+阅读 · 2015年10月12日
基于LDA的主题模型实践(二 )MCMC--吉布斯采样
机器学习深度学习实战原创交流
25+阅读 · 2015年9月17日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员