首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。  相似文献   

2.
以东莞市黄江等镇城市发展为例,利用逐步逻辑回归方法,获取分区的元胞自动机动态规则,用分区的动态规则CA模拟了研究区1988—2004年的城市扩张,采用逐点对比法和MoranI指数对模拟结果进行了评价。结果表明,分区的空间动态转换规则比统一的静态转换规则能获得更高的模拟精度,动态转换规则克服了传统静态转换规则无法反映区域内部城市发展差异的缺陷。  相似文献   

3.
叶康保  胡石元 《科技资讯》2006,(16):165-167
元胞自动机是能模拟复杂行为的离散动力学模型,GIS与元胞自动机的集成对于模拟地理时空过程具有很大的优势。但是标准CA的一些限制因素如空间尺度、精度及数据量问题、邻居定义等制约了其模拟真实世界的能力。本文通过分析地理现象和元胞自动机之间的关系,从元胞及状态、元胞空间、邻居、转换规则、离散时间五个方面对标准元胞自动机的组成部分进行了扩展,构建了在不规则的地理空间中基于地理实体的元胞自动机模型,同时提出了一个通用的基于地理实体的元胞自动机模型和地理信息系统集成的框架。  相似文献   

4.
基于元胞自动机理论提出一种改进混洗蛙跳算法. 该算法将元胞自动机嵌入到混洗蛙跳算法中改进分组策略, 应用云模型和混沌理论改进个体更新方式, 利用演化规则模拟生物进化的动态特征. 对6个基准函数进行测试的实验结果表明, 该算法具有较好的收敛精度和计算速度, 适用于多峰值函数寻优.  相似文献   

5.
地理元胞自动机及空间动态转换规则的获取   总被引:1,自引:0,他引:1  
 以东莞市黄江等镇城市发展为例,利用逐步逻辑回归方法,获取分区的元胞自动机动态规则,用分区的动态规则CA模拟了研究区1988-2004年的城市扩张,采用逐点对比法和Moran I指数对模拟结果进行了评价。结果表明,分区的空间动态转换规则比统一的静态转换规则能获得更高的模拟精度,动态转换规则克服了传统静态转换规则无法反映区域内部城市发展差异的缺陷。  相似文献   

6.
郭辉  王阳 《科技信息》2008,(30):26-27
针对数据挖掘中的分类问题,根据多分类器融合的思想,提出一种基于粒子群优化算法的多重决策树分类器融合方法。先将概率度量水平的多重决策树进行线性组合,然后在融合算法中采用粒子群算法优化连接权值矩阵。并在UCI标准数据集上对模型进行了实验研究。结果表明该融合分类方法比单个决策树分类方法具有更高的分类精度。  相似文献   

7.
提出一种基于聚类的启发式选择性集成学习算法.集成学习通过组合多个弱分类器获得比单一分类器更好的学习效果,把多个弱分类器提升为一个强分类器.理论上来说弱分类器的个数越多,组合的模型效果越好,但是随着弱分类器的增多,模型的训练时间和复杂度也随之递增.通过聚类的方法去除相似的弱分类器,一方面有效降低模型的复杂度,另一方面选出差异性较大的弱分类器作为候选集合.之后采用启发式的选择性集成算法,对弱分类器进行有效的组合,从而提升模型的分类性能.同时采用并行的集成策略,提高集成学习选取最优分类器子集效率,可以有效地减少模型的训练时间.实验结果表明,该算法较传统方法在多项指标上都有着一定的提升.  相似文献   

8.
基于2000年及2009年广州市TM影像解译得到的土地利用类型图,生成城市用地类型数据,选取道路、水系、城镇政府机构以及城市用地现状等影响因子,借助元胞自动机技术,构建城市用地变化的逻辑回归元胞自动机模型,模拟2009年广州市的城市用地变化,并验证预测结果;再基于2009年城市用地类型图,预测2018年广州城市用地情形.结果显示元胞自动机模型在城市用地变化的预测方面是可行的;若按照前一时段的发展趋势,至2018年时,建设用地面积将达25.215%,超过最新一轮城市规划拟定的指标,表明未来城市发展过程中,城市节约集约利用土地的必要性、迫切性;研究还表明,元胞状态发生转变的概率阈值的进一步研究是十分有价值的.  相似文献   

9.
自组织过程的随机元胞自动机模拟   总被引:2,自引:0,他引:2  
将随机机制引入元胞自动机,建立了若干自组织过程的随机元胞自动机模型;编制了Windows环境下的通用元胞自动机程序,成功地模拟了粒子扩散、沙堆崩塌、分形凝聚、晶体生长等动态过程。  相似文献   

10.
将随机机制引入元胞自动机,建立了若干自组织过程的随机元胞自动机模型;编制了Windows环境下的通用元胞自动机程序,成功模拟了粒子扩散、沙堆崩塌、分形凝聚、晶体生长等动态过程.  相似文献   

11.
集成学习是分类多变量时间序列的有效方法.然而集成学习对基分类器性能要求较高,基分类器组合算法优劣对分类效果影响较大.为此,提出一种基于Shapelets的多变量D-S(Dempster/Shafer)证据加权集成分类方法.首先,在单变量时间序列上学习得到基分类器Shapelets,基分类器的分类准确率确定为其在多分类器的权重.Shapelets是时间序列的子序列,不同变量Shapelets间不存在依赖关系,且单个Shapelets分类准确度较高,能得到“好而不同”的基分类器.然后,提出一种加权概率指派算法,增加分类准确率高的基分类器权重,减少分类准确率低的基分类器权重;添加了2个组合策略,即消除证据冲突,又提高了效率.在标准数据集上与多个最新算法进行比较,笔者算法取得了较好的分类结果.  相似文献   

12.
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差异的加权朴素贝叶斯(WNB)基分类器;尝试使用几种不同的方式将样本权重嵌入WNB基分类器的参数中,对WNB产生扰动,进一步增加基分类器的不稳定性.实验结果表明,对比AdaBoost所提算法,BoostMV-WNB能够明显提升WNB文本分类器的性能.  相似文献   

13.
人工智能和机器学习的发展为入侵电网数据采集与监视控制(supervisory control and data ac-quisition,SCADA)系统的虚假数据检测,提供了新的高效解决方案.目前,针对运用机器学习中的单分类器对电网中虚假数据的检测,出现的准确率低、误检率高、模型区分能力差等问题,提出了一种基于集成学...  相似文献   

14.
By combining multiple weak learners with concept drift in the classification of big data stream learning, the ensemble learning can achieve better generalization performance than the single learning approach. In this paper,we present an efficient classifier using the online bagging ensemble method for big data stream learning. In this classifier, we introduce an efficient online resampling mechanism on the training instances, and use a robust coding method based on error-correcting output codes. This is done in order to reduce the effects of correlations between the classifiers and increase the diversity of the ensemble. A dynamic updating model based on classification performance is adopted to reduce the unnecessary updating operations and improve the efficiency of learning.We implement a parallel version of EoBag, which runs faster than the serial version, and results indicate that the classification performance is almost the same as the serial one. Finally, we compare the performance of classification and the usage of resources with other state-of-the-art algorithms using the artificial and the actual data sets, respectively. Results show that the proposed algorithm can obtain better accuracy and more feasible usage of resources for the classification of big data stream.  相似文献   

15.
针对智能车辆在城区交通场景中的前向障碍物识别,提出了一种基于集成学习改进的二叉树支持向量机(BT-SVM)的多类分类方法。根据城区交通场景中各类障碍物的出现概率、模式类别差异,设计了适用于智能车辆障碍物识别的BT-SVM树型结构;对每个节点分类器,采用AdaBoost集成学习方法进行改进,有效减少了差错积累误差,提高了分类精度和泛化能力。试验表明该方法能有效地对城区交通场景中6类常规障碍物模式进行实时在线识别。  相似文献   

16.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.  相似文献   

17.
为了平衡集成学习中多样性与准确性之间的关系,并提高决策分类器的泛化能力,提出一种基于负相关学习和AdaBoost算法的支持向量机(SVM)集成学习方法.将负相关学习理论融合到AdaBoost-SVM的训练过程中,利用负相关学习理论计算基分类器间的相关性,并根据相关性的值自适应调整基分类器的权重,进而得到加权后的决策分类器.在UCI数据集中进行仿真,结果表明:相较于传统的负相关集成学习算法和AdaBoost-SVM算法,所提出的方法分类准确率更高,泛化能力更好.  相似文献   

18.
具有不平衡类分布的数据集在许多实际应用中是很常见的,但由于类分布不平衡,给那些已有的分类算法带来了很多问题。一种为处理不平衡类问题而开发的基于决策树和人工神经网络的有效组合方法被讨论。它基于数据抽样的方法构建组合分类器,并利用ROC曲线(Receiver Operating Characteristic curve)作为评价挖掘性能的分析工具,最后在PAKDD2007竞赛活动提供的实际数据上进行了有效性验证。  相似文献   

19.
【目的】为提高决策树集成的泛化能力和效率,解决集成全部决策树的情况下有时并不显著提高精度、反而导致额外存储和计算开销的问题,提出一种基于粗糙集的决策树集成学习算法。【方法】该算法基于粗糙集理论,从训练的全部决策树中选择一部分进行集成。【结果】与目前流行的集成学习算法Bagging和Boosting相比,本文提出的算法有效地减小了集成规模,并获得更好的泛化能力。【结论】该算法提高了决策树集成的泛化能力和效率。  相似文献   

20.
一种基于投票的不平衡数据分类集成算法   总被引:1,自引:1,他引:0  
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号