主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。   在这里,我们先定义一下主题究竟是什么。主题就是一个概念、一个方面。它表现为一系列相关的词语。比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“李彦宏”等词语就会以较高的频率出现,而如果涉及到“IBM”这个主题,那么“笔记本”等就会出现的很频繁。如果用数学来描述一下的话,主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。
BERTopic:NLP主题模型的未来!
夕小瑶的卖萌屋
2+阅读 · 2022年7月8日
NeurIPS 2021有哪些值得读的NLP论文?
PaperWeekly
0+阅读 · 2021年10月30日
知识增强的文本生成研究进展
专知
1+阅读 · 2021年3月6日
【ACL2020】BERT如何融合主题模型做文本匹配
深度学习自然语言处理
2+阅读 · 2020年12月7日
【KDD20】主题模型在图模型中的应用专题
深度学习自然语言处理
1+阅读 · 2020年10月3日
金融数仓体系建设
DataFunTalk
2+阅读 · 2020年7月23日
参考链接
子主题
微信扫码咨询专知VIP会员