首页 | 本学科首页   官方微博 | 高级检索  
     

一种有效的特征权重计算方法
引用本文:孙挺,耿国华,周明全. 一种有效的特征权重计算方法[J]. 郑州大学学报(理学版), 2008, 40(4): 48-51
作者姓名:孙挺  耿国华  周明全
作者单位:1. 西北大学可视化研究所,西安,710069;周口师范学院计算机系,河南,周口,466000
2. 西北大学可视化研究所,西安,710069
3. 北京师范大学信息科学与技术学院,北京,100875
基金项目:国家科技支撑计划重点项目
摘    要:研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中的重要程度.实验结果表明,该方法可以有效地改善分类性能.

关 键 词:文本分类  向量空间模型  特征权重

An Effective Term Weighted Method for Describing Term's Importance
SUN Ting , GENG Guo-hua , ZHOU Ming-quan. An Effective Term Weighted Method for Describing Term's Importance[J]. Journal of Zhengzhou University(Natrual Science Edition), 2008, 40(4): 48-51
Authors:SUN Ting    GENG Guo-hua    ZHOU Ming-quan
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号