基于LDA模型和语义网络的线上文本挖掘方法 |
| |
作者姓名: | 张思松 陈文 |
| |
作者单位: | 铜陵学院数学与计算机学院 |
| |
基金项目: | 安徽省高校自然科学研究重点项目(KJ2020A0698);;安徽省高等学校省级质量工程项目(2020szsfkc0895); |
| |
摘 要: | 传统线上文本挖掘方法在克服相似性干扰时,需要加入大量约束条件,降低了挖掘准确率。为此,本文提出基于LDA模型和语义网络的线上文本挖掘方法。采用滤波处理法对线上文本信息进行滤波处理,获得线上文本的抗干扰向量,提取线上文本信息的频谱特征。利用语义网络构建线上文本的语义网络挖掘模型,计算线上文本挖掘信息的相似度。基于LDA模型对获取的线上文本阈值进行分类,得到线上文本挖掘权值,将挖掘到的关系词带入到概念属性内,实现线上文本的挖掘。实验结果表明,基于LDA模型和语义网络的线上文本挖掘方法不仅可以提高挖掘精度,还具有更强的收敛性。
|
关 键 词: | LDA模型 语义网络 线上文本 挖掘方法 频率特征 挖掘模型 |
|
|