首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
决策树C4.5算法在森林资源二类调查中的应用   总被引:3,自引:0,他引:3  
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景.  相似文献   

2.
数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术.研究数据挖掘中的决策树算法以及决策树算法在具体的客户关系管理系统中的研究与分析,对数据挖掘中的决策树技术做了详细的描述.  相似文献   

3.
数据挖掘技术从产生以来得到了广泛的研究和应用,在数据的分类技术方面C4.5算法的研究已经比较成熟,但在学生成绩挖掘方面的应用比较少,本文首先论述了主要分类技术,详细介绍了C4.5决策树分类算法,并以实际学生成绩数据为依据,进行学生成绩的数据挖掘,通过对挖掘结果的分析表明,C4.5决策树算法高效、准确,是对学生成绩数据挖掘的首选工具.  相似文献   

4.
陈鹏 《南昌高专学报》2011,26(4):184-186
数据挖掘技术有不少应用于教育教学领域的成功范例。首先对数据挖掘技术进行描述,然后运用数据挖掘的C4.5决策树算法,对电大成人学员教学问卷调查数据进行处理、建模、分析,找出适合不同专业、不同年龄段学员的教学形式,实现个性化教学,提高教学效果。  相似文献   

5.
F:阐述数据挖掘的决策树算法,对ID3算法基本理论和原理进行介绍,运用该算法对教师教学质量测评数据进行分析,构造出质量测评数据决策树模型  相似文献   

6.
医疗数据中知识发现的研究   总被引:1,自引:0,他引:1  
介绍了ID3决策树算法建立决策树的基本原理和改进方法,利用改进的决策树算法对心脏病医疗诊断数据进行数据挖掘·采用VisualC++6 0进行编程建树,得到了一些有实际参考价值的诊断规则,获得了较高的分类准确率,证明了决策树算法在智能医疗诊断数据挖掘领域有着广泛的应用前景·  相似文献   

7.
介绍了数据挖掘和决策树生成算法,利用决策树生成工具对纳税人的税收数据进行挖掘,并对挖掘结果进行了分析。  相似文献   

8.
健康档案数据仓库的存储模型支持数据共享与交换、数据挖掘与分析.使用数据挖掘技术可以在海量的信息数据仓库中提取隐含的、潜在的、有价值的数据进行分析.利用Microsoft决策树算法的线性回归算法对数据进行慢性病诱因的数据挖掘具有重要的参考价值.  相似文献   

9.
研究数据预处理新技术,采用数据挖掘技术建立西部地区经济增长差异分析模型,在数据挖掘技术中采用决策树算法进行分析,克服现有算法的缺点,对现有算法进行改进优化,提高模型精度,得到省份分类情况及影响地区差距的主要相关要素.研究结果表明:相比于传统算法,数据挖掘技术更能找到数据间的内在规律,反映了数据挖掘寻找潜在数据规律的价值所在.  相似文献   

10.
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术.通过对数据挖掘决策树算法和未成年犯罪人员行为数据进行分析,找出其中潜在的规则为相关部门决策提供理论的支持.  相似文献   

11.
WILD:基于加权信息损耗的离散化算法   总被引:2,自引:0,他引:2  
现实应用中常常涉及许多连续的数值属性,而目前许多机器学习算法则要求所处理的属性具有离散值。基于信息论的基本原理,提出一种新的有监督离散化算法WILD,它可以看成是决策树离散化算法的一种扩充,其主要改进在于考虑区间内观测值出现的频度,采用加权信息损耗作为区间离散化的测试,以克服决策树算法离散不均衡的问题。该算法非常自然地采用了自底向上的区间归并方案,可以同时归并多个相邻区间,有利于提高离散化算法的速度,实验结果表明该算法能够提高机器学习算法的精度。  相似文献   

12.
在不平衡数据集中,多数类不一定是最优的,这一问题将会影响决策树的生成效果和分类预测的准确性,提出类置信度比例决策树算法,这种算法对类的大小不敏感.通过实验验证,这种算法比传统的决策树算法更具有优越性.  相似文献   

13.
分类是数据挖掘的重要组成部分,它根据类标号己知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。在众多的分类算法中决策树方法在可理解度、易训练性、易实施性和通用性等方面优于其他的分类方法。选择将决策树分类法应用到高考志愿填报研究中。  相似文献   

14.
Extensible Markup Language即"可扩展的标置语言"(简记为XML)的出现,为基于Web的数据挖掘带来了便利,开发人员能够用XML的格式标记交换数据。充分利用XML的优点,提供一种利用决策树ID3修正算法和聚类的方法,对XML文档信息进行挖掘,并结合实例说明这种方法。  相似文献   

15.
常见的决策树分类算法、贝叶斯分类算法、神经网络分类算法为数据挖据分类算法研究提供了重要基础。但面对海量数据时,在时间效率、鲁棒性和精确性上都显示出了不足。为此,本文将模糊聚类的思想引入到神经网络分类算法中,首先通过模糊聚类子模型,将样本数据聚为几个数据子集,然后再采用不同的神经网络对各个数据子集同时进行训练学习。由于经过了模糊聚类子模型的预处理,每个神经网络训练学习样本的复杂性大大减少,使神经网络的学习效率大大提高。最后通过UCI下的实际数据库,对提出的分类算法进行了检验,结果显示了基于模糊聚类的神经网络在数据挖掘分类中应用的有效性。  相似文献   

16.
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的.  相似文献   

17.
为解决癫痫脑电信号分类类别以及分类精度不足的问题,使用频率切片小波变换对脑电数据进行信号重构,得到5 个频段的节律信号,再利用非线性指标近似熵和线性指标波动指数共同作为癫痫信号的特征值,充分提取信号的特征信息。随后使用梯度提升树算法对得到的特征数据集进行多分类。实验表明,该算法对癫痫脑电信号的三分类识别率为98. 4%。较传统Adaboost 算法,该方法采取了GBDT( Gradient Boosting Decision Tree) 作为分类算法,成功利用更多的数据集,并且使得分类精度更高。  相似文献   

18.
基于粗糙集的RDT决策树生成算法的研究及应用   总被引:1,自引:0,他引:1  
介绍了一种基于粗糙集理论的决策树生成算法--RDT(Rought Set Decision Tree).该方法运用了粗糙集理论中条件属性相对于决策属性的核,引入启发式条件计算并选择条件属性作为决策树的根结点或子结点.通过一个例子,与运用信息熵概念建立决策树的算法进行比较,结果表明采用RDT方法得到的决策树优于采用信息熵方法得到的决策树.还讨论了RDT与ID3算法对决策树精度和规模的影响,分析数据分类和知识发现的过程及特点.  相似文献   

19.
基于规则的入侵检测系统中存在误报、漏报率高,检测速度慢等问题,为此在协议分析的基础上,提出一种基于决策树的协议解码方法。该方法使用扩展巴科斯范式描述检测规则,给出推理规则的定义;提出构造最优决策树和增量决策树的算法;通过构造基于决策树的入侵检测系统,将该方法与简单模式匹配,与基于动态规则集、基于状态转换两种协议解码方法进行了比较。实验结果表明:基于扩展巴科斯范式的协议解码方法,在误报率方面比其他3种方法分别降低10.08%,0.1%,1.51%;在漏报率方面分别降低15.56%,3.68%,2.86%。  相似文献   

20.
在X-Tree的基础上,提出了一种新的动态索引方法C-Tree。该方法继承了X-Tree超节点的观点,针对X-Tree分裂算法的不足,给出了新的分裂算法,并通过理论和实验数据,证明了C-Tree的整体性能优于X-Tree。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号