首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

2.
基于多关系的空间分类算法研究   总被引:1,自引:0,他引:1  
空间数据挖掘的应用领域很广,空间分类是空间数据挖掘中一项重要的任务,现有的空间分类算法都是基于传统的方法,在单表上进行的.本文提出了一种新的空间分类算法,基于多关系的方法创建决策树,并验证了算法的正确性及有效性.  相似文献   

3.
给出了一种基于编码二叉树的支持向量机(SVM,Support Vector Machine)的多类分类算法.首先,定义了一种构造编码二叉树的方法,在此基础上合理的使用每个训练样本对应的编码来对多类样本进行划分,使之转化为两类分类问题.由算法的实现过程可以看出,本算法可以大大减少子分类器的构造个数,从而简化了多类SVM分类算法.  相似文献   

4.
以往波束形成算法将潜在声源区域划分成若干网格,所有的声源被映射到一个个网格点上,会导致错误的声源定位与强度计算,并且计算精度与效率受网格间距大小的影响。采用多层感知机神经网络以及无网格策略,能够提高声源识别的空间分辨率与计算效率。通过使用单个平面麦克风阵列对三维等强度双点声源进行识别定位,发现相较于传统互谱算法,多层感知机能够改善平面阵列在深度方向上较差的空间分辨率性能。此外,在定位误差方面,多层感知机优于传统互谱算法,同时声源识别的强度误差有所降低。在低频时,多层感知机性能优于波束形成算法,可用来弥补波束形成算法空间分辨率性能不佳的局限性。  相似文献   

5.
在二叉树结构支持向量机(SVM)多分类算法的基础上,针对二叉树算法中点和叶盲目划分的问题,提出了一种新的二叉树SVM多分类算法.该算法通过标记划分的方法,一方面解决了盲目划分的问题,另一方面大大减少了子分类器的数目,大幅度提高了算法的速度.实验结果表明,该算法具有一定的优越性.  相似文献   

6.
提出一种改进随机子空间与C4.5决策树算法相结合的分类算法.以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出.实验结果表明,该方法对少数类和多数类均具有较高的识别率.  相似文献   

7.
用聚类支持向量机模型监测环保设备运行状态   总被引:2,自引:0,他引:2  
针对环保设备多状态监测与识别问题,提出了一种基于多分类聚类支持向量机的分类算法模型.该算法模型充分利用多个相关联被监测设备及其状态属性特征,采用神经网络聚类分析获得关联特征的聚类子空间,再对聚类子空间构造二叉树支持向量机进行多分类识别.该算法模型避免了盲目分类,与单纯的支持向量机算法比较具有更好的分类性能.通过对日本大晃船用污水处理装置实测样本的训练、检验表明,该算法具有98%以上的分类识别率.  相似文献   

8.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

9.
基于复合式衡量准则的决策树生成算法   总被引:4,自引:0,他引:4  
分析了多种已有的衡量准则(如信息熵准则、Twoing准则、Gini准则、MaxMinority准则、SumMinority准则),并在此基础上提出了采用复合式衡量准则的决策树生成算法.在一定程度上克服了采用单种衡量准则所带来的算法不稳健性问题,并改善了决策树的结构和分类正确率.  相似文献   

10.
提出了一种用于解决射频识别系统中的碰撞问题的方法——动态多叉树搜索算法,新算法分析了动态二叉树算法和四叉树算法的优缺点,改进了动态二叉树搜索算法,并通过Schoute算法估计标签数量,选择调整搜索叉树,解决了多标签识别的碰撞问题,理论和仿真证明了新算法的优越性,即减少搜索的时隙数并提高了时隙的吞吐率.  相似文献   

11.
本文提出了基于分离程度的SVM决策树的焊缝缺陷分类识别方法。首先对X射线焊缝图像进行缺陷特征提取,然后结合聚类的思想,定义了分离程度,每次将分离程度最大的缺陷类分离出来,成功解决了传统欧氏距离不能处理的类交叉分类情况,得到了累积误差更小的决策树。将基于分离程度的二叉树的多类SVM算法运用于X射线焊接缺陷图像的分类识别,通过计算机仿真,表明该方法比其它SVM多分类算法在分类精度和识别效果方面有明显的提高。  相似文献   

12.
目标跟踪一直是计算机视觉领域的重要研究课题,广泛应用于视频监控、交通监视、医学诊断等领域。文中提出了一种基于二叉树模型的目标跟踪算法,该方法通过二叉树分块,将图像的目标区域分割为若干大小不一的同类块,块内像素相近,可用一个值或向量统一表示;块间像素差距较大,从而构成整个目标的特征描述模型。并从准确性和跟踪速度两个方面对CT算法、基于四叉树模型的算法(QT算法)和提出的基于二叉树模型的算法(BT算法)进行了比较,结果表明:与基于四叉树模型的算法相比,基于二叉树模型的跟踪算法在准确性方面几乎不受影响的前提下,跟踪速度显著提升;与以跟踪速度快闻名的判别式CT算法相比,在跟踪速度大致相当的前提下,跟踪准确性却更好。  相似文献   

13.
郭辉  王阳 《科技信息》2008,(30):26-27
针对数据挖掘中的分类问题,根据多分类器融合的思想,提出一种基于粒子群优化算法的多重决策树分类器融合方法。先将概率度量水平的多重决策树进行线性组合,然后在融合算法中采用粒子群算法优化连接权值矩阵。并在UCI标准数据集上对模型进行了实验研究。结果表明该融合分类方法比单个决策树分类方法具有更高的分类精度。  相似文献   

14.
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.  相似文献   

15.
提出一种基于双支持向量机的偏二叉树多类分类算法,偏二叉树双支持向量机多类分类算法.该算法综合了二叉树支持向量机和双支持向量机的优势,实现了在不降低分类性能的前提下,大大缩短训练时间.理论分析和UCI(University of California Irvine)机器学习数据库数据集上的实验结果共同证明,偏二叉树双支持...  相似文献   

16.
在处理不平衡数据集时,为了降低类重叠对分类效果的影响,避免过采样造成的过拟合现象,以及欠采样造成的信息丢失问题,本文提出一种基于欠采样与属性选择的多决策树方法UAMDT(multi-decision tree based on under-sampling and attribute selection)。其首先利用Tomek link欠采样与集成欠采样两种技术相结合对数据进行处理,并获得多个平衡子集;然后在每个平衡子集上构建单决策树,采用结合信息增益和基尼指数的混合属性度量作为属性选择标准,选择最优属性作为每棵单决策树的根节点的分裂属性;最后将单决策树进行集成构建多决策树。通过对10个不平衡数据集的多个评估指标进行实验,验证了本文算法的有效性和可行性。  相似文献   

17.
论述基于核函数的方法,包括支持向量机的分类、聚类与回归算法,基于核的Fisher判别分析、感知机和主成分分析,介绍学习算法、简化算法和多类分类等研究课题,及基于核函数方法的应用.  相似文献   

18.
在决策树算法中,即使存在两个"最好"属性,也只是随机选择一个作为根或节点属性.因此,决策树算法产生的分类规则较少.此外,决策树算法采用全匹配测试实例,测试实例最多匹配一条分类规则甚至没有匹配,进而影响分类准确率.针对该问题,提出了基于双属性节点部分匹配的决策树改进算法(DAID3):首先,如果存在两个信息熵相等或相近的"最好"属性,DAID3算法选择两个属性构建节点,它们的属性值及组合作为分枝.因此,每个训练实例可能被多条分类规则覆盖.其次,判断新实例时,在分枝节点上可能匹配到多条路径,为了选择最好路径,为每个分枝节点设置了节点强度.最后,如果不存在一条从根节点到叶子节点的路径全匹配测试实例,则找出部分匹配该实例的路径,返回该路径的终节点强度最大的类标值.为了便于部分匹配时返回强度最大的类标值,为每一个分枝节点设置节点类标值.实验结果表明,与决策树算法相比,DAID3算法具有分类规则多且有更高的分类准确率.  相似文献   

19.
提出了一种基于决策树C4.5的多示例学习算法C4.5-MI,通过拓展C4.5的熵函数和信息增益比来适应多示例学习框架.应用梯度提升方法对C4.5-MI算法进行优化,得到效果更优的GDBT-MI算法.与同类决策树算法在benchmark数据集上进行比较,结果表明,C4.5-MI和GDBT-MI算法具有更好的多示例分类效果.  相似文献   

20.
针对分类数据,基于属性分组技术和多目标聚类质量函数,提出一种子空间聚类算法.该算法采用属性分组技术,将高相关属性划分到同属性组中,利用同组属性相关性度量属性权重值,构建属性软子空间;采用基于多目标的聚类质量函数,判断整体聚类效果,通过迭代优化簇集结构,达到最佳的数据划分状态.在人工合成数据集和UCI数据集上,实验验证了该算法的正确性、高效性和可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号