首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于类空间密度的文本分类特征加权算法
引用本文:贾隆嘉,孙铁利,杨凤芹,孙红光.基于类空间密度的文本分类特征加权算法[J].吉林大学学报(信息科学版),2017,35(1).
作者姓名:贾隆嘉  孙铁利  杨凤芹  孙红光
作者单位:东北师范大学计算机科学与信息技术学院,长春130117;东北师范大学智能信息处理吉林省高校重点实验室,长春130117
基金项目:长春市科技局基金资助项目,吉林省科技厅基金资助项目,吉林省发改委基金资助项目
摘    要:特征加权是一种依据特征在分类中起到的作用为特征赋予相应权重的过程,是为了提高分类性能而为特征标记权重的策略.基于类空间密度提出了两个新的特征加权算法:tf* ICSDF和ICSDF-based.实验中,在RCV1-4和20 Newsgroups数据集上,采用支持向量机分类器将提出的方法进行了验证.实验结果显示,该方法相比传统的特征加权方法(prob-based、tf*icf和icf-based)可以有效地提升文本分类性能.

关 键 词:特征加权  类空间密度  文本分类  机器学习

Class Space Density Based Weighting Scheme for Automated Text Categorization
JIA Longjia,SUN Tieli,YANG Fengqin,SUN Hongguang.Class Space Density Based Weighting Scheme for Automated Text Categorization[J].Journal of Jilin University:Information Sci Ed,2017,35(1).
Authors:JIA Longjia  SUN Tieli  YANG Fengqin  SUN Hongguang
Abstract:
Keywords:term weighting  class space density  text categorization  machine learning
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号