导读
准确地表示出用户所感兴趣的话题的数量和特征,是话题演化研究领域的一个重要课题,对当今互联网信息环境意义尤为重大。搜索引擎可以从存档数据中提供某话题的信息检索,但不能以结构化的方式反映用户对主题的兴趣强度的变化。
本文从多个角度回顾、总结了近10年中重要的基于概率主题模型的话题演化研究工作。文章首先介绍了本文涉及的基础主题模型、术语、和符号,总结了基于概率主题模型的三类话题演化模型:离散时间话题演化模型、连续时间话题演化模型、以及在线话题演化模型。
文章还描述了话题演化模型的多种应用,并总结了模型泛化性能评估、话题演化评估方法、和不同模型的比较试验结果。
最后,文章讨论了基于概率主题模型的话题演化研究工作中的挑战以及未来可能的研究方向。
文章精要
如需阅读本期推荐文章的全文,请点左下角的「阅读原文」链接。
Frontiers of Computer Science
Frontiers of Computer Science 是由教育部主管、高等教育出版社和德国 Springer 公司共同出版的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。
长按二维码关注Frontiers of Computer Science公众号