基于改进的在线LDA模型的主题演化分析

来源期刊:中南大学学报(自然科学版)2015年第2期

论文作者:何建云 陈兴蜀 杜敏 江浩

文章页码:547 - 554

关键词:主题演化;主题遗传;主题强度;LDA模型

Key words:topic evolution; topic genetic; topic intensity; LDA model

摘    要:为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集中程度为文档设置不同的权值,该方法可以有效降低宽泛主题的强度得分;利用模型主题对齐的特点,采用Jensen-Shannon距离横向计算话题间的关联。实验结果表明:本文提出的方法能够有效地在线分析主题的演化。

Abstract: To sove the problem of topic mixing and new topic untimely detection in the traditional OLDA, an improved online LDA(IOLDA) model was presented based on OLDA. The different heritability for each topic was set according to the topic intensity. Furthermore, a new method was introduced to evaluate topic intensity. By calculating a weight for each document according to the concentration of the mixture distribution over topics, this method can effectively reduce the score of broad topics. Since the model is able to align topics across the epochs, topic association can be captured easily via Jensen-Shannon Divergence. The results show that the proposed method is efficient for analyzing topic evolution online.

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号