基于LDA模型的WEB文本分类 |
| |
作者姓名: | 孟海涛 陈思 周睿 |
| |
作者单位: | 1. 盐城工学院,信息工程学院,江苏,盐城,224051 2. 北京大兴区第一中学国际部,北京,102600 |
| |
摘 要: | 提出了基于LDA(Latent Dirichlet Allocation)主题模型的Web文本分类方法,利用MCMC方法中的Gibbs抽样获得模型参数从而获取词汇的概率分布,使隐藏于WEB文本内的不同主题与WEB文本字词建立关系。将LDA算法应用于WEB文本分类识别领域,在实验中与k均值聚类和贝叶斯网络方法进行了对比,其结果表明LDA与其他同类算法相比具有一定的优势。
|
关 键 词: | LDA 主题模型 WEB分类 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《盐城工学院学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《盐城工学院学报(自然科学版)》下载免费的PDF全文 |
|