首页 | 本学科首页   官方微博 | 高级检索  
     

在线增量标签主题模型
作者姓名:陈永恒  左祥麟  林耀进
作者单位:1. 闽南师范大学 计算机学院, 福建 漳州 363000; 2. 吉林大学 计算机科学与技术学院, 长春 130012
摘    要:将文本之间存在的时序关联性元信息和文档的标签信息, 引入到隐藏Dirichlet分配模型中, 提出一种在线增量标签主题(on line labeled incremental topic model, OLT)模型. 首先, 在线增量标签主题模型优化了文本标签元信息与主题之间的映射关系; 其次, 利用动态字典增加了模型与文本的拟合程度. 该模型优化了
先验分布超参数迁移计算的连续性, 解决了隐藏Dirichlet分配(LDA)模型不能利用文本属性与主题之间的相关性进行主题发现及演变分析的问题. 实验结果表明, 所提出的在线增量标签主题模型能显著改善多标签判别精度, 提高模型的泛化能力并提升模型的运行性能.

关 键 词:信息处理  隐藏Dirichlet分配(LDA)模型  自然语言处理  主题模型  
收稿时间:2014-12-22
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号