项目名称: 大数据环境下稀疏主题模型理论及其应用研究

项目编号: No.61370070

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 王春立

作者单位: 大连海事大学

项目金额: 75万元

中文摘要: 世界范围的信息变革将我们带入大数据时代,其数据体量巨大、类型繁多、价值密度低、挖掘难度大的特点阻碍了从中获取价值的步伐。近年来兴起的主题模型是从海量数据中发现隐含语义的有效工具,本项目针对主题模型的一种- - 稀疏主题模型进行深入的研究,从概率层面、样本层面和模型层面学习到大数据中稀疏的、富有语义的特征描述。首先,利用无监督和半监督稀疏主题模型学习判定性特征,实现概率层面稀疏到样本层面稀疏的跳跃;然后,以判定性稀疏特征为基础,将度量学习和排序学习与稀疏主题模型相结合,力图学习到唯一的序列特征,实现样本层面稀疏到模型层面稀疏的跃进;为了在大数据环境下高效求解所提出的模型,本项目还将研究稀疏主题模型的高效参数推断方法;最后,将所提的稀疏主题模型应用到基于主题的图像分类检索和基于多文档自动文摘的便携式移动设备社会化新闻阅读,以对模型加以验证,同时还可以进一步推动图像检索和自动文摘领域的研究。

中文关键词: 主题模型;图像检索;自动文摘;;

英文摘要: Worldwide information revolution has lead us into the era of big data. The characteristics of big data, such as huge amount, variety types, low value density, difficult to mine, have been hindering our pace to derive the value in it.The topic model is on

英文关键词: Topic Model;Image Retrieval;Documentation Summarization;;

成为VIP会员查看完整内容
0

相关内容

主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。   在这里,我们先定义一下主题究竟是什么。主题就是一个概念、一个方面。它表现为一系列相关的词语。比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“李彦宏”等词语就会以较高的频率出现,而如果涉及到“IBM”这个主题,那么“笔记本”等就会出现的很频繁。如果用数学来描述一下的话,主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
122+阅读 · 2021年6月12日
《多任务学习》最新综述论文,20页pdf
专知会员服务
121+阅读 · 2021年4月6日
知识图谱在智能制造领域的研究现状及其应用前景综述
专知会员服务
151+阅读 · 2021年2月25日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
专知会员服务
189+阅读 · 2020年10月14日
专知会员服务
29+阅读 · 2020年9月13日
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
101+阅读 · 2019年1月9日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
基于LDA的主题模型实践(三)
机器学习深度学习实战原创交流
23+阅读 · 2015年10月12日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
25+阅读 · 2018年1月24日
小贴士
相关VIP内容
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
122+阅读 · 2021年6月12日
《多任务学习》最新综述论文,20页pdf
专知会员服务
121+阅读 · 2021年4月6日
知识图谱在智能制造领域的研究现状及其应用前景综述
专知会员服务
151+阅读 · 2021年2月25日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
专知会员服务
189+阅读 · 2020年10月14日
专知会员服务
29+阅读 · 2020年9月13日
相关资讯
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
101+阅读 · 2019年1月9日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
基于LDA的主题模型实践(三)
机器学习深度学习实战原创交流
23+阅读 · 2015年10月12日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员