首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种近似等频离散化方法
引用本文:蒋盛益,李霞,郑琪.一种近似等频离散化方法[J].暨南大学学报,2009,30(1).
作者姓名:蒋盛益  李霞  郑琪
作者单位:广东外语外贸大学信息学院,广东,广州,510006
基金项目:国家自然科学基金,广东省高等学校自然科学研究重点项目,广东外语外贸大学科研创新团队项目 
摘    要:在数据挖掘和机器学习研究中,许多算法以离散值为处理对象,常常需要对连续属性进行离散化.由于正态分布的广泛性,本文提出一种基于正态分布的近似等频离散化方法.该方法实现简单,关于数据集大小具有线性时间复杂度,适用于大规模数据集.在许多数据集上与文献中多个离散化方法进行了对比测试,实验结果表明,提出的无指导的离散化方法是有效、可行的.

关 键 词:正态分布  离散化  等频方法

Approximate equal frequency discretization method
JIANG Sheng-yi,LI Xia,ZHENG Qi.Approximate equal frequency discretization method[J].Journal of Jinan University(Natural Science & Medicine Edition),2009,30(1).
Authors:JIANG Sheng-yi  LI Xia  ZHENG Qi
Institution:College of Information;Guangdong University of Foreign Studies;Guangzhou 510006;China
Abstract:Many algorithms for data mining and machine learning require that training examples contain only discrete attributes.In order to use these algorithms when some attributes have numeric attributes,the numeric attributes must be converted into discrete attributes.Because of the extensiveness of normal distribution,an approximate equal frequency discretization method which based on normal distribution is presented.The method is simple to implementation.Time complexity of the presented discretization method is n...
Keywords:normal distribution  discretization  equal frequency method  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号