首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为获得网络赌博犯罪行为涉案电子证据的分布规律,针对网络赌博案例库所导出的训练样本集,提出容粗糙集属性约简思想的决策树分类预测算法,由属性约简进行决策树预剪枝,将属性重要性度量融入决策树分支属性结点的选择过程,案例拟合验证表明所建决策树分类模型具有较高的分类预测精度,所获预测规则可有效指导网络赌博案件的侦破。  相似文献   

2.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

3.
基于决策树的知识表示模型及其应用   总被引:3,自引:2,他引:1       下载免费PDF全文
针对数据挖掘过程中的数据库精炼问题,在分析现行属性约简方法的特点和不足的基础上,结合决策树算法操作简单、分类速度快的特点,通过知识的规则化描述以及规则族之间的相似性比较,建立了一种基于决策树的属性约简方法(简记为BD-RED),讨论了规则族之间的相似性度量的可释化构建问题,给出了BD-RED的具体实施策略,并结合实例分析了BD-RED的性能。结果表明,BD-RED具有良好的结构特征和较强的可操作性,可以有效实现不同决策理念下的属性约简,适合不同类型的大规模数据库的属性约简。  相似文献   

4.
分析了全断面掘进机复杂的故障机理和运行参数,研究了将粗糙集和决策树应用到数据挖掘中的方法.以全断面掘进机刀盘的一些实时数据为例,采用MATLAB 7.0对数据进行离散化处理,结合粗糙集属性约简的算法对故障样本进行冗余属性的约简;然后,利用决策树算法对约简后的故障样本集进行规则提取,利用数据挖掘工具Clementine实现了C4.5算法和改进的C4.5算法,对其结果进行了对比分析;最后,运用VB编程对全断面掘进机采集的部分数据进行测试,结果表明该融合算法是一种快速、有效、可靠的故障检测与诊断的新途径.  相似文献   

5.
为寻找最优决策树,对决策树生成方法进行了研究,提出了属性相似度的计算方法,引入了属性相似度,对测试属性进行约简.在此基础上,提出了以属性相似度为启发规则的决策树生成算法.该方法预测精度高,计算简便.  相似文献   

6.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法,并将该算法应用于胶合板缺陷检测.通过粗糙集属性约简,找出造成胶合板缺陷的关键因素;再基于约简后的决策表,使用该决策树算法构建决策树,从而提取分类规则,指导决策过程.通过实验验证了,该算法可以有效对胶合板的缺陷进行检测.  相似文献   

7.
针对非相容表构建决策树中属性约简计算复杂度较高的问题,基于粗糙集分辨关系和粒计算理论,建立一种对相容表和非相容表通用的构建决策树算法。该算法首先根据非相容表的逻辑关系式证明其可经过变量替代等价于相容表;然后根据等价表的特点,以属性粒为基本单位,用属性粒的可分辨量、属性粒相对于决策属性的类别数量、决策表中相同行的数量这3个基本参数确定属性的优劣,并以最优属性为划分属性自上向下直接构建决策树。实例分析结果表明,应用该算法构建决策树具有简洁、有效性。  相似文献   

8.
Rough集在乳腺癌辅助诊断中的应用   总被引:1,自引:0,他引:1  
目的研究Rough集在乳腺癌辅助诊断中的应用。方法采用基于Rough集的属性约简算法,利用决策树算法对乳腺癌图像数据进行分类,辅助医疗诊断。结果实现了基于Rough集的属性约简算法,对乳腺癌数据进行处理,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明Rough集在辅助医疗诊断中有着广泛的应用前景。  相似文献   

9.
不完备信息系统中的属性约简一直是粗糙集研究领域的一个难点.在不完备信息系统中,用以往的属性约简算法得到的约简结果中,某一属性要么属于该约简,要么不属于该约简.但在实际生活中,当属性以比较大的概率可区分两对象时,这就表明该属性可能以某一概率属于约简结果.基于这种想法,文中通过构造概率区分矩阵,并在此基础上给出相应的区分函数,提出了一种概率属性约简算法,分析了算法正确性.从该算法得到的约简,可以看出各属性属于约简的可能性.最后用实例表明该算法是有效和可行的.  相似文献   

10.
信息系统中正区域性质的研究与应用   总被引:2,自引:0,他引:2  
针对约简算法的基本问题,作了分析和研究:提出并证明正区域的一种新的等价定义,以此推导了高效的正区域基本算法;对不同约简属性集所对应的属性子集、论域子集和正区域,给出它们相互关系的性质,及关于正区域递增算法约简属性性质的推论.综合以上分析和研究。给出了一种完备、高效的属性约简算法,实验结果和理论分析表明:本研究可有效地应用于属性约简算法分析和构建.  相似文献   

11.
基于相似依赖度的属性加权决策树算法   总被引:2,自引:1,他引:1  
粗糙集分析方法利用数据本身提供的信息,不需要任何先验知识即可对已有的知识进行处理,在保留关键信息的前提下,对数据进行简化并求得属性组合。在此基础上提出了一种基于相似依赖度的属性选择算法,从约简出的属性组合中选择与决策属性最为相似的核集,根据属性的相似依赖度作为决策树的加权值,从而建立决策树。通过对影响学生成绩因素的数据进行分析表明,所提出的算法是易于实施的,而且形成的决策树的准确率也有了一定的提高。  相似文献   

12.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

13.
文章对现有启发式属性约简算法进行分析,通过实例说明一般启发式算法求得的相对约简有冗余属性存在的问题。针对这一不足,在算法中加入消除冗余属性的二次约简过程,得到一种改进的启发式属性约简算法。提供了实例分析,验证了该改进算法具有较好的约简效果。  相似文献   

14.
文章对现有启发式属性约简算法进行分析,通过实例说明一般启发式算法求得的相对约简有冗余属性存在的问题.针对这一不足,在算法中加入消除冗余属性的二次约简过程,得到一种改进的启发式属性约简算法.提供了实例分析,验证了该改进算法具有较好的约简效果.  相似文献   

15.
海量数据属性约简的研究是数据挖掘研究中的一个难点。已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理。结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法。利用该算法可以快速得到海量数据的属性约简结果。仿真实验结果说明了该算法的高效性。  相似文献   

16.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性.  相似文献   

17.
基于粗糙集属性变分区的属性约简   总被引:1,自引:1,他引:0  
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

18.
决策树是医疗数据挖掘中一种重要分类方法,针对原始医疗数据存在大量重复样本和冗余属性,影响医疗诊断的精度和速度这一问题,提出了一种基于粗糙集和ID3算法相结合的决策树方法.将所提方法应用于冠心病诊断决策,并对属性约简前后的决策性能进行了比较分析.实验表明了该方法的有效性和实用性.  相似文献   

19.
本文在研究粗糙集、决策树与粒计算的基础上,结合Hash算法快速、高效的特点,提出了一种基于Hash的快速值约简方法.该方法在处理信息系统过程中,能够快速划分等价类,并计算出正区域;在基于粗糙集理论针对每一个属性进行属性约简和值约简的过程中,利用Hash方法能够对数据压缩的特点,实现快速高效的规则提取.通过仿真实验显示,...  相似文献   

20.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号