共查询到19条相似文献,搜索用时 78 毫秒
1.
文中给出了基于属性值出现的频率的连续属性离散化的一种方法。在离散化问题描述的基础上,利用属性值出现的频率确定频数候选断点,再利用边缘断点算法进一步减少断点数目,达到离散化目的。该方法提高了决策属性关于条件属性的支持度,提高了属性约简的满意度。 相似文献
2.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性. 相似文献
3.
概念学习中连续值型属性的离散化 总被引:1,自引:0,他引:1
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明,这种方法一有得到较合理的区间划分。 相似文献
4.
连续属性的离散化是粗糙集理论亟待解决的关键问题之一。基于灰色系统和粗糙集的有关理论,提出了
一种新的基于属性重要性的离散化算法。该算法以条件属性对决策属性的灰色关联度来度量条件属性的重要性,
在保证决策表原始分类能力不变的前提下,按照属性重要性由小到大的顺序对每个条件属性的侯选断点进行考
察!将冗余的断点去掉,从而将条件属性离散化。同时给出了该算法的时间复杂度分析,并通过实例分析验证了算
法的有效性和实用性。 相似文献
5.
连续型属性的离散化问题是机器学习中的关键问题,是一个NP难题.该文针对决策表,在NaiveScaler算法的基础上,给出了一种直观、有效和易于理解的离散化方法.该方法从整个属性空间的角度来考虑属性的离散化问题,可有效地保证决策表中原有分类结果的不变性. 相似文献
6.
一种基于聚类的粗糙集连续属性的离散化算法 总被引:4,自引:0,他引:4
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具。粗糙集理论只能对离散属性进行处理,而不能处理连续属性。中针对这一缺陷,利用连续数值属性有序性的性质和统计方差理论,提出了一种基于聚类的连续属性离散化算法。运用典型数据将本算法与现有方法进行了比较分析,得到了满意的结果。 相似文献
7.
连续属性离散化是粗糙集应用研究的重点内容之一.基于条件熵可以反应属性依赖度的性质,将决策属性对条件属性的条件熵作为离散化标准,提出了一种粗糙集连续属性离散化方法,并通过实例证明了该方法的正确性. 相似文献
8.
一种连续属性离散化的新算法 总被引:5,自引:0,他引:5
沈东升 《漳州师范学院学报》2003,16(4):27-30
连续属性的离散化问题是机器学习、数据挖掘等领域中重要研究课题之一,本文深入讨论连续属性离散的各种方法,提出一种基于RS理论和条件信息熵的决策表条件属性离散化算法,计算简单、易实现并以实例加以说明。 相似文献
9.
提出一种基于粗糙集中连续属性离散化和支持向量机(SVM)的分类预测算法。首先,提出一种新颖的Improved Chi2离散化技术,将其作为预处理器将连续属性数据离散化,然后应用粗糙集理论进行属性约简和规则提取,删去冗余的属性和样本,在横向和纵向均大大降低了数据的维度,降低了样本的存储要求,而且没有失去原始决策表所表达的信息。应用支持向量机进行分类建模预测,大大降低了SVM分类过程中的复杂度,不会降低分类能力。仿真实验表明了本文算法的有效性,不仅分类预测精度高,且训练速度快了。 相似文献
10.
一种基于粗糙集理论的连续属性离散化方法 总被引:14,自引:0,他引:14
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的· 相似文献
11.
阐述了粗集理论的基本思想,给出了一个基于粗集的知识发现系统模型,并通过实例说明了这一模型的有效性。 相似文献
12.
粗集在知识发现中的应用 总被引:4,自引:0,他引:4
粗集作为一种数据分析理论,能有效地从不确定性的数据中发现知识,是目前在知识发现领域研究的热点之一。首先对粗集理论做了简单介绍,在此基础上论述了粗集作为一种数学工具在知识发现领域中的重要问题,并提出粗集的进一步可能发展方向。 相似文献
13.
针对在使用粗糙集理论处理决策表时需要事先对连续属性进行离散化处理的问题,提出了一种基于连续属性分布特征的离散化算法.并通过实例分析说明该算法能在保证决策表原始分类能力不变的前提下,获得较少的断点数. 相似文献
14.
15.
为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性预插入断点对信息系统近似分类质量的影响,来确定要插入断点的属性,从全局属性范围选择最佳断点.根据Ameva统计量来判断属性中最佳断点的位置,并以保证决策表的近似分类质量作为算法的终止条件.实验采用多... 相似文献
16.
从粒度计算的观点出发,给出了信息系统中知识距离的定义,指出利用知识距离可以度量信息系统中知识的粗糙性,分析了其相关性质.提出了一种基于知识距离的启发式属性约简算法,算法不需求核,对无核的特殊信息系统计算约简更加有效. 相似文献
17.
18.
19.
提出了通过数据挖掘技术实现基于有限元仿真结果的知识发现.分析了数据挖掘的一般步骤,建立了基于有限元仿真结果的知识发现系统,论述了知识发现系统的各个模块及实现该系统的关键技术;对粗糙集和主成分分析法作了简单的介绍,并举实例对粗糙集方法作了说明.通过数据挖掘技术将计算实例提炼出来,作为一种知识源参与到设计优化过程中去,将CAE从设计验证层次提升到设计驱动层次. 相似文献