首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
首先介绍了决策树算法的基本理论和建模过程及传统的决策属性的选取标准。然后介绍了传统的ID3决策树算法,并对常用决策树算法的优缺点进行了总结。以经典的决策树ID3模型为基础,对已有决策属性挑选策略进行了分析和总结,对决策属性挑选策略进行了改进,提出了基于"相关信息增益度"的决策属性挑选策略。该方法基于信息增益的计算标准,并通过引入属性间相关性关系对传统ID3算法"多值偏向性"的缺陷进行补偿。最后,将该方法应用于UCI数据中心的标准数据集合中,从分类精确度方面对改进的ID3算法和传统ID3算法进行比较和分析。通过实验分析,改进的E-ID3算法在分类精确度方面有更优秀的性能表现。  相似文献   

2.
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现.  相似文献   

3.
对自然手写体汉字联机识别系统中笔画和字根提取问题作了深入研究,提出并改进了有关策略和算法实现。经深入分析和测试结果表明,由于充分考虑了自然手写体汉字的书写习惯和结构特征,技术策略和算法实现具有高稳定性和变形容忍度。  相似文献   

4.
对传统ID3算法的信息熵作近似变换达到简化计算的目的,并针对ID3算法倾向于选择取值较多的属性和排斥属性值分布均匀的属性两个缺点,引入贡献因子来改进ID3算法,使属性选择方法平衡的选择划分属性.实验表明,优化后的属性选择方法降低了分类时间,优化了分类结果并能很好地反映实际情况.  相似文献   

5.
文章为研究脱机手写体汉字识别问题,将汉字样本及其特征向量看作是一个信息系统,采用基于β近似依赖度的属性重要度定义作为启发式信息,设计出在变精度粗糙集模型下的特征属性近似约简算法,对手写体汉字信息系统中冗余特征属性进行约简,构建出脱机手写体汉字识别决策信息系统。识别过程中采用基于加权规则置信度的规则融合方法,进一步提高了脱机手写体汉字的可识别性和正确识别率。实验结果表明,该方法是有效可行的。  相似文献   

6.
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,该算法对含有粘连和重叠现象的手写体汉字文本的切分是有效的,从而可使手写体汉字的切分准确率有较大的提高.  相似文献   

7.
针对ID3算法倾向于选择取值较多的属性的缺点,首先引入属性重要性进行改进,然后根据ID3算法中信息增益的计算特点,利用凸函数的性质进行简化,减少了信息增益的计算量,提高ID3算法中信息增益的计算效率.实验证明,优化ID3算法与传统ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

8.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

9.
引入ID3算法的大学生体育训练决策支持系统可以根据学生的特征对其分类。而传统的决策树ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实。本文运用了一种基于灰色关联度的修正因子属性选择方法予以改进,克服了传统ID3算法的不足,改进的ID3算法可使分类更加精确,更好的为大学生体育训练提供决策支持。  相似文献   

10.
文章针对脱机手写体汉字特征约简与识别中离散化不当的问题,构建出基于实域粗糙集的脱机手写体汉字识别决策信息系统。提出了实域粗糙集中特征属性的广义重要度的概念以及空间中的广义近邻关系;设计了在广义近邻关系下基于实域粗糙集模型的特征属性约简算法,构建出基于实域粗糙集的脱机手写体汉字识别决策信息系统;采用基于变粒度仿反馈机制的智能认知模型对脱机手写体汉字识别决策信息系统进行仿反馈识别,并建立了变粒度仿反馈机制智能识别方法的评价指标体系和认知信息粒度变换规则,提出基于变粒度仿反馈机制的智能认知算法。对SCUT-IRAC HCCLIB样本库中的汉字进行了仿真实验研究,平均识别精度达到95.37%。仿真实验表明,相比于传统认知系统单向开环方式,该文提出的方法对提升脱机手写体汉字的识别效率、可识别性及正确识别率是有效可行的。  相似文献   

11.
阐述了ID3决策树算法原理,分析了汽车评测数据,提出了应用决策树来处理汽车评测问题的方法,该方法利用训练数据的信息增益来构建评测模型,并通过对评测模型的查找来完成其它数据的分类预测.实验结果表明:利用决策树来处理汽车评测问题具有良好的预测准确率.  相似文献   

12.
在变精度粗糙集模型的基础上,通过定义近似分类质量来对条件属性进行选择,在ID3算法的基础上生成决策树,实现了对ID3算法的改进,使分类速度加快,并且有效地解决了含噪数据的分类问题。  相似文献   

13.
增量决策树算法及复杂度分析   总被引:5,自引:1,他引:5  
介绍了增量决策树算法的基本原理,并从实例费用和信息熵费用两个角度出发,对增量决策树算法的复杂度进行分析.通过实例说明,增量决策树算法能够构造出与ID3算法形态基本相同的决策树.  相似文献   

14.
ID3算法的改进和简化   总被引:2,自引:0,他引:2  
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

15.
通过对决策树算法的研究,特别是分析了ID3的基本算法过程,指出其应用中的多种缺陷,提出了用模糊概念来解决传统决策树中过分匹配,从而提高决策树用于知识获取性能的思想.结合树的深度优先算法、模糊包含度函数和模糊不确定函数,提出了具体实现模糊决策树(FDT)算法,并在注塑模浇口设计中加以应用.该算法具有如下优点:在相同精度条件下,大量压缩知识,在将来知识推理中极大地避免了组合爆炸的可能性;随着应用的不断深入,FDT获取的知识会逐渐集中在领域中常用的和重要的知识上.  相似文献   

16.
改进的ID3算法在高校就业系统中的应用分析   总被引:2,自引:0,他引:2  
为有效利用高校就业管理工作中多年来积累的大量数据,通过对数据挖掘中常用的决策树ID3算法进行研究,结合就业信息的特点对ID3算法进行了改进,并对改进的ID3算法进行了分析,指出了决策属性对就业的影响。  相似文献   

17.
朱红超 《科技信息》2010,(35):I0098-I0099
民航应急救援是民航航空安全系统的重要组成部分,是航空安全的基本保障。在救援过程中,救援等级的决策直接影响到对整个事态的评估及所需救援措施、救援力量的确定。在救援等级决策中,利用粗糙集理论对传统的决策树构造算法——ID3算法作了一些改进,对原始数据表进行属性约简,并在决策树的构造过程中引入粗糙度,得出了较好的救援等级决策规则。  相似文献   

18.
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵值计算过程,以获得具有全局最优的挖掘结果,并针对UCI数据集中的6类数据集展开挖掘实验.结果表明:改进后的挖掘算法在决策树构建的简洁程度和挖掘精度上,都明显优于ID3型决策树挖掘算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号