首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征项扩展的中文文本分类方法
引用本文:陈立伟,井志强,葛秘蕾. 基于特征项扩展的中文文本分类方法[J]. 应用科技, 2010, 37(3): 1-4,29. DOI: 10.3969/j.issn.1009-671X.2010.03.001
作者姓名:陈立伟  井志强  葛秘蕾
作者单位:哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001
基金项目:国家自然科学基金资助项目 
摘    要:提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.

关 键 词:文本分类  特征选择  特征项扩展  特征义原

A Chinese text classification method based on feature expansion
CHEN Li-Wei,JING Zhi-qiang,GE Mi-lei. A Chinese text classification method based on feature expansion[J]. Applied Science and Technology, 2010, 37(3): 1-4,29. DOI: 10.3969/j.issn.1009-671X.2010.03.001
Authors:CHEN Li-Wei  JING Zhi-qiang  GE Mi-lei
Affiliation:CHEN Li-Wei,JING Zhi-qiang,GE Mi-lei (College of Information , Communication Engineering,Harbin Engineering University,Harbin 150001,China)
Abstract:
Keywords:text classification  feature selection  feature expansion  feature sememe  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号