首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中心聚类和语义特征融合的网页信息文本挖掘方法
引用本文:符保龙,张爱科.中心聚类和语义特征融合的网页信息文本挖掘方法[J].辽宁工程技术大学学报(自然科学版),2016(1):85-88.
作者姓名:符保龙  张爱科
作者单位:柳州职业技术学院电子信息工程系
基金项目:广西教育厅科研项目基金项目(201106LX745,201204LX593)
摘    要:针对网页信息内容丰富且结构复杂,难以准确挖掘的问题,采用中心聚类和语义特征相互融合的方法.利用中心聚类算法确定样本最终的聚类中心,根据每个词在网页中出现的频率和词的上下文语义,构造一个网页-词语的权重映射矩阵,并将语义特征作为中心聚类相似性的判断依据,完成网页文本信息的挖掘.实验结果表明:利用该方法对网页文本进行挖掘,在时间增加不多的情况下,可以获得更高的召回率和准确率.

关 键 词:中心聚类  语义特征  矩阵  网页信息  文本挖掘
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号