首页 | 本学科首页   官方微博 | 高级检索  
     

文本聚类中的特征选择方法
引用本文:龚静,曾建一. 文本聚类中的特征选择方法[J]. 吉首大学学报(自然科学版), 2008, 29(2): 39-41
作者姓名:龚静  曾建一
作者单位:湖南环境生物职业技术学院信息技术系,湖南衡阳,421005;湖南环境生物职业技术学院信息技术系,湖南衡阳,421005
摘    要:
介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.

关 键 词:特征选择  文本聚类  中文文本
文章编号:1007-2985(2008)02-0039-03
修稿时间:2007-09-02

Way of Feature Selection Based on Text Clustering
GONG Jing,ZENG Jian-yi. Way of Feature Selection Based on Text Clustering[J]. Journal of Jishou University(Natural Science Edition), 2008, 29(2): 39-41
Authors:GONG Jing  ZENG Jian-yi
Affiliation:(Department of Information Technology,Hunan Environment-Biological Polytechnic,Hengyang 421005,Hunan China)
Abstract:
Three feature selection ways are presented for texts clustering:document frequency,term strength,entropy-based feature ranking.A comparative experiment was conducted on the there ways by using a Chinese corpus.Results show that feature selection way of TS is the best choice for the results in text clustering.
Keywords:feature selection  text clustering  Chinese text
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《吉首大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《吉首大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号