首页 | 本学科首页   官方微博 | 高级检索  
     

基于投影寻踪回归文本自动分类的模型
引用本文:廖海波,万中英,王明文. 基于投影寻踪回归文本自动分类的模型[J]. 清华大学学报(自然科学版), 2005, 45(9): 1823-1827
作者姓名:廖海波  万中英  王明文
作者单位:江西师范大学,计算机信息工程学院,南昌,330027;江西师范大学,物理与通信电子学院,南昌,330027
基金项目:教育部重点科技资助项目(03070);江西省自然科学基金资助项目(0311041);江西师范大学校管课题青年成长基金(1090)
摘    要:文本被表示为向量空间模型后,是维数非常高的数据,对其进行维数约简是必要的.投影寻踪正是一种稳健的、非参数化的维数约简方法.提出了一种基于投影寻踪回归的文本自动分类模型.应用该模型,可以真实地描述高维数据的客观内在规律,从而达到提高文本分类精度的目的,岭函数拟合函数的合理选择是提高分类精度的关键,故对拟合函数的选取做了初步的研究.采用标准文档集Reuters-21578进行了分类实验,同时在相同的预处理条件下,与目前常用的方法进行了对比实验.实验结果表明,该模型对文本自动分类具有较高的召回率和准确率.

关 键 词:文本分类  维数约简  投影寻踪回归
文章编号:1000-0054(2005)S1-1823-05
修稿时间:2005-05-20

Automated text classification model based on projection pursuit regression
LIAO Haibo,WAN Zhongying,WANG Mingwen. Automated text classification model based on projection pursuit regression[J]. Journal of Tsinghua University(Science and Technology), 2005, 45(9): 1823-1827
Authors:LIAO Haibo  WAN Zhongying  WANG Mingwen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号