首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 201 毫秒
1.
为获得影响未成年人犯罪程度的重要因素,在论证基于属性约简的决策树分类算法适于处理多属性大容量数据表的基础上,将该算法应用于未成年人犯罪行为的分析。分析过程首先从公安业务数据库中提取未成年人犯罪行为的相关信息并建立决策表,同时利用条件属性相对于决策属性的依赖关系进行属性约简,最终针对约简结果生成决策树获取规则,运行结果表...  相似文献   

2.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

3.
为寻找最优决策树,对决策树生成方法进行了研究,提出了属性相似度的计算方法,引入了属性相似度,对测试属性进行约简.在此基础上,提出了以属性相似度为启发规则的决策树生成算法.该方法预测精度高,计算简便.  相似文献   

4.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

5.
数据挖掘和机器学习应用于入侵检测是当今的研究热点,但其中大部分算法的学习或分类时间长,制约了入侵检测的应用。将粗糙集用于网络侦听的海量数据的属性约简可以提高入侵检测速度,提高效率。提出的一个新的属性约简算法约简冗余属性,使用朴素贝叶斯分类器进行分类预测。实验表明,该方法分类准确率高、时间消耗少,能够提高入侵检测的效率。  相似文献   

6.
基于决策树的知识表示模型及其应用   总被引:3,自引:2,他引:1       下载免费PDF全文
针对数据挖掘过程中的数据库精炼问题,在分析现行属性约简方法的特点和不足的基础上,结合决策树算法操作简单、分类速度快的特点,通过知识的规则化描述以及规则族之间的相似性比较,建立了一种基于决策树的属性约简方法(简记为BD-RED),讨论了规则族之间的相似性度量的可释化构建问题,给出了BD-RED的具体实施策略,并结合实例分析了BD-RED的性能。结果表明,BD-RED具有良好的结构特征和较强的可操作性,可以有效实现不同决策理念下的属性约简,适合不同类型的大规模数据库的属性约简。  相似文献   

7.
决策树是医疗数据挖掘中一种重要分类方法,针对原始医疗数据存在大量重复样本和冗余属性,影响医疗诊断的精度和速度这一问题,提出了一种基于粗糙集和ID3算法相结合的决策树方法.将所提方法应用于冠心病诊断决策,并对属性约简前后的决策性能进行了比较分析.实验表明了该方法的有效性和实用性.  相似文献   

8.
一种新型决策树属性选择标准   总被引:7,自引:0,他引:7  
讨论传统决策树算法中三种常用的基于熵的属性选择标准,提出一种基于属性重要性排序的建立决策树的新方法。该方法在决策树的每个内结点首先依据属性重要性将属性进行排序,然后选择最重要的属性作为分类属性生成决策树,并抽取出规则。与传统的决策树数据分类方法相比,此方法可有效地选择出对于分类最重要的分类属性,增强决策树的抗干扰能力,并提高规则的预测精度。  相似文献   

9.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法,并将该算法应用于胶合板缺陷检测.通过粗糙集属性约简,找出造成胶合板缺陷的关键因素;再基于约简后的决策表,使用该决策树算法构建决策树,从而提取分类规则,指导决策过程.通过实验验证了,该算法可以有效对胶合板的缺陷进行检测.  相似文献   

10.
Rough集在乳腺癌辅助诊断中的应用   总被引:1,自引:0,他引:1  
目的研究Rough集在乳腺癌辅助诊断中的应用。方法采用基于Rough集的属性约简算法,利用决策树算法对乳腺癌图像数据进行分类,辅助医疗诊断。结果实现了基于Rough集的属性约简算法,对乳腺癌数据进行处理,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明Rough集在辅助医疗诊断中有着广泛的应用前景。  相似文献   

11.
利用移动机器人的传感器提取的特征参数,通过属性约简方法构造的决策树形成的分类规则实现室内环境的识别.该方法在环境参数发生变化时,会导致机器人环境识别错误的问题.为此提出了一种利用多个约简构成的分类规则并通过取极值的方法,可避免环境识别错误的问题.  相似文献   

12.
在定性分析的基础上,提取影响成人高校毕业生学位评审的12个指标,并利用粗糙集理论与LVQ神经网络的各自优势,构建了一个粗糙集-LVQ神经网络成人高校毕业生学位评审预测模型。粗糙集作为前置系统,在分类能力不变的前提下对属性进行约简,得到两个属性个数均为7的最小条件属性约简集,利用LVQ神经网络进行分类处理。实证分析中,该模型对两个最小条件属性约简集进行择优选择,并对胜选的属性约简训练样本与全部属性训练样本的分类能力进行对比,最后,利用该模型与LVQ进行了相关参数比较。结果表明,文章构建的粗糙集-LVQ预测模型与LVQ网络相比,输入矢量减少了42%,运行效率提高了75%,准确识别率提高了14.4%。  相似文献   

13.
基于粗糙集决策树优化研究   总被引:2,自引:0,他引:2  
决策树分类方法是一种有效的数据挖掘分类方法.单变量决策树结构简单,但规模较大.多变量决策树是为了进一步缩减树的规模而提出的决策树结构,通过选取属性的合理组合作为分裂属性,可使树的规模相对较小.文章在对以往所提出的混合变量决策树算法RSH2的抗噪性差和属性被多次选取等问题进行改进的基础上,提出了基于粗糙集的多变量决策树算法VPMDT.通过与ID3、HACRs、RSH2和C4.5等算法进行的实验比较表明,VPMDT有较好的时空性能,并保持较高的分类预测正确率.  相似文献   

14.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

15.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

16.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

17.
基于相似依赖度的属性加权决策树算法   总被引:1,自引:1,他引:1  
粗糙集分析方法利用数据本身提供的信息,不需要任何先验知识即可对已有的知识进行处理,在保留关键信息的前提下,对数据进行简化并求得属性组合。在此基础上提出了一种基于相似依赖度的属性选择算法,从约简出的属性组合中选择与决策属性最为相似的核集,根据属性的相似依赖度作为决策树的加权值,从而建立决策树。通过对影响学生成绩因素的数据进行分析表明,所提出的算法是易于实施的,而且形成的决策树的准确率也有了一定的提高。  相似文献   

18.
在数据挖掘和机器学习的过程中,分类器的主要任务是提高数据分类的精确度和降低数据分类的费用开销,本文针对传统分类器只考虑了如何提高数据分类的精确度而没有考虑到如何降低数据分类的开销缺陷,提出了一种基于属性开销约束的矩阵属性约简算法,定义了一种新的函数作为属性约简的启发信息,探讨了基于矩阵方法计算等价关系矩阵的增量更新机制.该算法缩短了粗糙集属性约简的计算时间,保证了属性约简的实时性,并通过实例进一步验证了所提出方法的有效性和正确性.  相似文献   

19.
基于贝叶斯决策树的交通事件持续时间预测   总被引:2,自引:2,他引:0  
采用基于贝叶斯方法的决策树算法,利用上海市中心城区1536个交通事件持续时间数据,建立交通事件持续时间的预测模型.结果表明,事件类型是决策树中的第一层测试属性,不同类型事件的特性属性在决策树中的位置并不相同.并用384个交通事件数据对模型的预测精度进行检验.检验结果表明,抛锚事件持续时间预测误差小于10 min的正确率为79%,而交通事故持续时间预测误差小于20 min的正确率为65%.基于贝叶斯推理的决策树算法比仅基于贝叶斯或仅基于决策树算法的分类精度更高,鲁棒性更强.  相似文献   

20.
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号