首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于改进互信息的文本分类方法
引用本文:裴志利,李志刚,王建,孔英,梁艳春,卢弈南.一种基于改进互信息的文本分类方法[J].内蒙古民族大学学报(自然科学版),2007,22(4):377-380.
作者姓名:裴志利  李志刚  王建  孔英  梁艳春  卢弈南
作者单位:1. 内蒙古民族大学,数学与计算机科学学院,内蒙古,通辽,028043;吉林大学,计算机科学与技术学院,吉林,长春,130012
2. 吉林省统计局计算中心,吉林,长春,130051
3. 大连医科大学,辽宁,大连,116023
4. 吉林大学,计算机科学与技术学院,吉林,长春,130012
基金项目:国家自然科学基金;国家自然科学基金;吉林省科技发展计划;高等学校博士学科点专项科研项目;吉林大学面向21世纪教育振兴行动计划(985计划)
摘    要:用改进的互信息公式进行特征选择,通过三种文本分类方法验证了改进的公式具有较高的准确率、召回率和F1值,从而证明改进的互信息公式的有效性.

关 键 词:文本分类  特征选择  互信息  F1值
文章编号:1671-0185(2007)04-0377-04
收稿时间:2007-01-16
修稿时间:2007-01-16

Based on a Kind of Method to Categorize Text of Improve the Mutual Information
PEI Zhi-li,LI Zhi-gang,WANG Jian,KONG Ying,LIANG Yan-chun,LU Yi-nan.Based on a Kind of Method to Categorize Text of Improve the Mutual Information[J].Journal of Inner Mongolia University for the Nationalities(Natural Sciences),2007,22(4):377-380.
Authors:PEI Zhi-li  LI Zhi-gang  WANG Jian  KONG Ying  LIANG Yan-chun  LU Yi-nan
Institution:1.College of Mathematics and Computer Science,Inner Mongolia University for Nationalities,Tongliao 028043,China;2.College of Computer Science and Technology,Jilin University,Changchun 130012,China;3.Computation Centre of Statistics Bureau of Jilin Province,Changchun 130051,China;4.Dalian Medical University,Dalian 116023,China
Abstract:Feature selection is done according to improved mutual information formats that is verified to have superior accuracy rate,recall rate and F1 value through three kinds of methods to categorize text,thereby the validity of improved mutual information formats is verified.
Keywords:Text categorize  Feature selection  Mutual information  F1 value
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号