首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种改进的文本特征选择方法
引用本文:魏海平.一种改进的文本特征选择方法[J].科学技术与工程,2012,12(12):3002-3004.
作者姓名:魏海平
作者单位:辽宁石油化工大学计算机与通信工程学院,抚顺,113001
摘    要:随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。本文使用向量空间模型(VSM)来表示网页文本,提出了一种改进X2的文本特征选择方法,最后通过支持向量机方法进行分类。实验结果表明,相对于传统的X2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的X2统计方法。

关 键 词:文本分类  特征选择  X2统计
收稿时间:2/7/2012 11:36:00 AM
修稿时间:2/7/2012 11:36:00 AM

An improved text feature selection method
weihaiping.An improved text feature selection method[J].Science Technology and Engineering,2012,12(12):3002-3004.
Authors:weihaiping
Institution:*(School of Computer & Communication Engineering,Liaoning Shihua University,Fushun 113001,P.R.China)
Abstract:With the rapid development of Internet technology,there are many categories of information on the Web.Therefore the technology of Web page classification becomes more and more meaningful.Using the vector space model(VSM) to indicate the page text.A feature selection method is presented to improve χ2statistical methods.Finally support vector machine is usd to classify.Through a text classification experiment,the results show that compared with traditional χ2 statistical methods,the improved feature selection method is better than traditional χ2 statistical methods.
Keywords:Text Classification  Feature selection  X2 statistics
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号