首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
为获得影响未成年人犯罪程度的重要因素,在论证基于属性约简的决策树分类算法适于处理多属性大容量数据表的基础上,将该算法应用于未成年人犯罪行为的分析。分析过程首先从公安业务数据库中提取未成年人犯罪行为的相关信息并建立决策表,同时利用条件属性相对于决策属性的依赖关系进行属性约简,最终针对约简结果生成决策树获取规则,运行结果表...  相似文献   

2.
本文在研究粗糙集、决策树与粒计算的基础上,结合Hash算法快速、高效的特点,提出了一种基于Hash的快速值约简方法.该方法在处理信息系统过程中,能够快速划分等价类,并计算出正区域;在基于粗糙集理论针对每一个属性进行属性约简和值约简的过程中,利用Hash方法能够对数据压缩的特点,实现快速高效的规则提取.通过仿真实验显示,...  相似文献   

3.
为寻找最优决策树,对决策树生成方法进行了研究,提出了属性相似度的计算方法,引入了属性相似度,对测试属性进行约简.在此基础上,提出了以属性相似度为启发规则的决策树生成算法.该方法预测精度高,计算简便.  相似文献   

4.
基于粗糙集和决策树的数据挖掘方法   总被引:9,自引:1,他引:9  
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果·  相似文献   

5.
利用移动机器人的传感器提取的特征参数,通过属性约简方法构造的决策树形成的分类规则实现室内环境的识别.该方法在环境参数发生变化时,会导致机器人环境识别错误的问题.为此提出了一种利用多个约简构成的分类规则并通过取极值的方法,可避免环境识别错误的问题.  相似文献   

6.
分析了近似质量在提取非确定性规则方面的不足,并基于粗糙熵的预测成功度概念,结合时序数据特点,提出一种属性约简及规则提取策略.该策略在对时序数据进行属性约简时,采用粗糙熵与时间距离相结合的方法,使得最终得到的约简在时序方面是较优的,最后使用UCI数据库进行仿真实验,效果良好.该策略在工程领域处理时序数据方面有一定的应用价值.  相似文献   

7.
为获得网络赌博犯罪行为涉案电子证据的分布规律,针对网络赌博案例库所导出的训练样本集,提出容粗糙集属性约简思想的决策树分类预测算法,由属性约简进行决策树预剪枝,将属性重要性度量融入决策树分支属性结点的选择过程,案例拟合验证表明所建决策树分类模型具有较高的分类预测精度,所获预测规则可有效指导网络赌博案件的侦破。  相似文献   

8.
分析了全断面掘进机复杂的故障机理和运行参数,研究了将粗糙集和决策树应用到数据挖掘中的方法.以全断面掘进机刀盘的一些实时数据为例,采用MATLAB 7.0对数据进行离散化处理,结合粗糙集属性约简的算法对故障样本进行冗余属性的约简;然后,利用决策树算法对约简后的故障样本集进行规则提取,利用数据挖掘工具Clementine实现了C4.5算法和改进的C4.5算法,对其结果进行了对比分析;最后,运用VB编程对全断面掘进机采集的部分数据进行测试,结果表明该融合算法是一种快速、有效、可靠的故障检测与诊断的新途径.  相似文献   

9.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法,并将该算法应用于胶合板缺陷检测.通过粗糙集属性约简,找出造成胶合板缺陷的关键因素;再基于约简后的决策表,使用该决策树算法构建决策树,从而提取分类规则,指导决策过程.通过实验验证了,该算法可以有效对胶合板的缺陷进行检测.  相似文献   

10.
规则提取算法中通常先约简属性再约简属性值,但该算法当属性数量增多时,会增加约简的复杂性,从而影响规则提取的速度.针对此问题,本文提出了一种基于偏序关系的粗糙集规则提取方法.首先,在不同粒度的知识空间上建立偏序关系;然后,利用各知识空间中隐含的属性冗余度作为启发式信息,对冗余属性进行逐层约简;最后,在约简后的属性集上提取决策规则.实例表明,该方法降低了属性约简的复杂性,提高了规则提取的速度.  相似文献   

11.
一种新型决策树属性选择标准   总被引:7,自引:0,他引:7  
讨论传统决策树算法中三种常用的基于熵的属性选择标准,提出一种基于属性重要性排序的建立决策树的新方法。该方法在决策树的每个内结点首先依据属性重要性将属性进行排序,然后选择最重要的属性作为分类属性生成决策树,并抽取出规则。与传统的决策树数据分类方法相比,此方法可有效地选择出对于分类最重要的分类属性,增强决策树的抗干扰能力,并提高规则的预测精度。  相似文献   

12.
研究不完备形式背景的属性约简问题。通过比较对象间属性值的一致性, 定义了对象集上的一个相似关系, 进而定义了基于相似关系的粗糙近似算子, 利用目标集的粗糙集近似, 可以提取语义明确的决策规则。基于不完备形式背景中相似关系给出一种属性约简的概念, 研究了属性约简的判定定理, 给出了三类属性的特征刻画。 最后, 利用对象间的辨识属性, 给出了一种属性约简的方法, 并举例说明了方法的可行性。  相似文献   

13.
首先定义了决策规则决策属性的简化,并以此为基础定义了决策表决策值的简化,旨在研究决策表条件值简化的对偶问题,即在保持决策表条件属性集不变的前提下它的条件属性集和决策属性集之间的最简函数关系。在这些定义的基础上,给出了决策规则决策属性简化的表达式和决策表决策值简化的表达式。  相似文献   

14.
一种改进的决策树算法   总被引:1,自引:0,他引:1  
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向.  相似文献   

15.
Rough集理论提供了一种新的处理不精确、不完全与不相容知识的数学方法,在决策表中快速、有效地挖掘出缺省规则。本文将Rough集属性约简应用到判定树归纳分类方法中,明显优化判定树,简化数据挖掘的过程。  相似文献   

16.
研究了一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系.通过构建模型,从理论上证明了以信息熵作为度量标准,ID3算法是最优的,生成的树是最小的,产生的规则数是最少的.  相似文献   

17.
应用粗糙集理论将旋转机械转子的频域信息作为研究对象, 从转子故障实验的频域图表及其相关数据中, 构造符合粗糙集理论要求的决策表, 并对决策表进行约简, 得到旋转机械故障诊断的决策规则, 通过区分矩阵和区分方程寻找决策表的约简和核, 最后优化鳞选出决策表的最小约简形式.  相似文献   

18.
粗糙集理论的主要思想是在保持分类能力不变的前提下,通过属性约简和值约简,提取决策规则。本文主要是提出了利用隶属度函数进行值约简的同时提取决策规则的算法。利用该算法可在不求得核值表的情况下,直接找到各规则的最小条件属性集,获得决策表的所有决策规则。  相似文献   

19.
对基于粗糙集的决策系统,从理论上分析了决策数据细化的程度对规则近似质量、近似分类精度、核属性和信息熵的影响.证明了决策属性的属性值划分越细,则其规则近似质量、近似分类精度和信息熵就越小,并且决策表中决策属性值细化后所得到的核属性集一定包含细化前的核属性集.因此,在对决策属性离散化时,决策数据细化的程度要适宜.研究结果对研究决策表属性的约简、决策规则的形成和有效性等问题具有实际意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号