首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于属性重要性和样本信息熵的多连续属性离散化后处理方法
引用本文:康曙光,裴志利,孔英.基于属性重要性和样本信息熵的多连续属性离散化后处理方法[J].内蒙古民族大学学报(自然科学版),2009,24(2).
作者姓名:康曙光  裴志利  孔英
作者单位:1. 内蒙古民族大学,计算机科学与技术学院,内蒙古,通辽,028043
2. 大连医科大学,辽宁,大连,116027
摘    要:有效判别决策表中离散化后样本数据的类型对于对后继阶段的机器学习和数据挖掘过程具有非常重要的意义.本文提出了一种基于属性重要性和样本信息熵的数据类型判别方法,并利用人工改造的一部分UCI数据库进行了模拟试验,结果表明方法是有效的,识别样本数据的准确率较高、识别错误率和拒识率较低.

关 键 词:决策表  离散化  属性重要性  样本信息熵

Treatment Method after Discretization of Continuous Attributes Based on Attributes Importance and Samples Entropy
KANG Shu-guang,PEI Zhi-li,KONG Ying.Treatment Method after Discretization of Continuous Attributes Based on Attributes Importance and Samples Entropy[J].Journal of Inner Mongolia University for the Nationalities(Natural Sciences),2009,24(2).
Authors:KANG Shu-guang  PEI Zhi-li  KONG Ying
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号