项目名称: 大数据环境下稀疏主题模型理论及其应用研究
项目编号: No.61370070
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 王春立
作者单位: 大连海事大学
项目金额: 75万元
中文摘要: 世界范围的信息变革将我们带入大数据时代,其数据体量巨大、类型繁多、价值密度低、挖掘难度大的特点阻碍了从中获取价值的步伐。近年来兴起的主题模型是从海量数据中发现隐含语义的有效工具,本项目针对主题模型的一种- - 稀疏主题模型进行深入的研究,从概率层面、样本层面和模型层面学习到大数据中稀疏的、富有语义的特征描述。首先,利用无监督和半监督稀疏主题模型学习判定性特征,实现概率层面稀疏到样本层面稀疏的跳跃;然后,以判定性稀疏特征为基础,将度量学习和排序学习与稀疏主题模型相结合,力图学习到唯一的序列特征,实现样本层面稀疏到模型层面稀疏的跃进;为了在大数据环境下高效求解所提出的模型,本项目还将研究稀疏主题模型的高效参数推断方法;最后,将所提的稀疏主题模型应用到基于主题的图像分类检索和基于多文档自动文摘的便携式移动设备社会化新闻阅读,以对模型加以验证,同时还可以进一步推动图像检索和自动文摘领域的研究。
中文关键词: 主题模型;图像检索;自动文摘;;
英文摘要: Worldwide information revolution has lead us into the era of big data. The characteristics of big data, such as huge amount, variety types, low value density, difficult to mine, have been hindering our pace to derive the value in it.The topic model is on
英文关键词: Topic Model;Image Retrieval;Documentation Summarization;;