首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于潜在语义结构的文本分类模型
引用本文:曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报(自然科学版),2004,32(Z1):99-102.
作者姓名:曾雪强  王明文  陈素芬
作者单位:江西师范大学,计算机信息工程学院,江西,南昌,330027
摘    要:潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能比LSI模型更好地表示原始文档空间中的潜在语义结构.

关 键 词:文本分类  潜在语义索引  偏最小二乘法
文章编号:1000-565X(2004)S-0099-04
修稿时间:2004年8月31日

A Text Classification Model Based on the Latent Semantic Structure
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号