首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于进化模糊规则的Web新闻文本挖掘与分类方法
引用本文:史玉珍,吕琼帅.基于进化模糊规则的Web新闻文本挖掘与分类方法[J].湘潭大学自然科学学报,2016(2):99-103.
作者姓名:史玉珍  吕琼帅
摘    要:针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.

关 键 词:Web新闻  文本分类  进化模糊规则  余弦距离  词频  逆向文档频率算法
本文献已被 CNKI 等数据库收录!
点击此处可从《湘潭大学自然科学学报》浏览原始摘要信息
点击此处可从《湘潭大学自然科学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号