首页 | 本学科首页   官方微博 | 高级检索  
     

基于聚类和信息熵的特征选择算法
引用本文:李霞,蒋盛益,郭艾侠. 基于聚类和信息熵的特征选择算法[J]. 郑州大学学报(理学版), 2009, 41(1)
作者姓名:李霞  蒋盛益  郭艾侠
作者单位:1. 广东外语外贸大学信息学院,广州,510006
2. 华南农业大学信息学院,广州,510642
基金项目:国家自然科学基金,广东省高等学校自然科学研究重点项目,广东外语外贸大学科研创新团队项目
摘    要:针对分类属性数据,基于信息熵,提出一种度量特征重要程度的定义.结合聚类分析,提出一种无指导的特征选择方法.该方法时间复杂度与数据集的大小和特征个数近似成线性关系,适合于大规模数据集中的特征选择.实验结果表明,该方法具有较好的性能,提出的特征选择方法有效实用.

关 键 词:聚类  信息熵  特征选择  大规模数据集

A Feature Selection Algorithm Based on Clustering and Information Entropy
LI Xia , JIANG Sheng-yi , GUO Ai-xia. A Feature Selection Algorithm Based on Clustering and Information Entropy[J]. Journal of Zhengzhou University(Natrual Science Edition), 2009, 41(1)
Authors:LI Xia    JIANG Sheng-yi    GUO Ai-xia
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号