首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.  相似文献   

2.
本研究提出基于妊娠早期体检、基因信息,结合集成学习的妊娠期糖尿病预测分类方法.设计了基于Stacking框架的改进模型ACS-Stacking.ACS-Stacking模型将基分类器输出的类别概率值作为基层输出结果,元层使用GBDT模型学习组合基层输出的类别概率结果,拓展了算法的层次结构.在基分类器层与元分类器层之间加入基分类器筛选层,通过CFS算法估计不同分类器集合中个体分类器准确性与多样性的权衡值,筛选出最佳基分类器集合,实现基分类器的自适应选择.研究结果表明,该模型F1值较单一模型提高约9%,较Stacking模型提高约7%,具有较好的预测准确性和稳定性.  相似文献   

3.
研究表明,具有较大边际分别的组合分类器泛化性能更高.根据该结论,论文构造了一个新的基于边际的度量指标(MM)以充分考虑基分类器和组合分类器的分类能力,进而提出了一种新的组合分类器选择方法.该方法初始化组合分类器为空(或满),迭代的加入(或移除)具有最大(或最小)MM值的分类器,以降低组合分类器规模并提高它的分类准确率.在随机选择的24个UCI数据集上的实验表明,与其他一些高级的贪心组合选择算法相比,该方法具有更好的泛化能力.  相似文献   

4.
针对基于单一神经网络的软件可靠性模型预测精度低和可信性差的问题,提出一种基于加权信息熵(WIE)的Real BP-AdaBoost算法。首先,用BP神经网络个体代替Real AdaBoost算法的基分类器,构建Real BP-AdaBoost算法。然后,对Real BP-AdaBoost算法的加权方式进行改进,以基分类器对训练样本的整体分类权值与基分类器对测试样本的个体分类权值的乘积作为最终的加权系数,得到WIE Real BP-AdaBoost算法。最后,通过2组软件实际失效数据对WIE Real BP-AdaBoost算法的有效性进行验证,并与SVM、BP网络、Elman网络和Real BP-AdaBoost算法进行比较研究。实验结果显示,WIE Real BP-AdaBoost算法对2组数据预测的均方误差分别为0.442 87和0.284 71,均低于4个对比模型的均方误差,说明了WIE Real BP-AdaBoost算法模型具有更高的预测精度和可信性。  相似文献   

5.
为了预测基坑的测斜最大水平位移及深度,提出了基于粗糙集(RS)属性约简、平均影响值(MIV)和极限学习机(ELM)的组合模型RS-MIV-ELM.在系统分析、量化变形影响因素的基础上,利用RS属性约简算法和基于ELM的MIV算法(ELM-MIV)分别去除影响因素集中的冗余因素和相关性极小的因素,以简化模型输入变量;采用简化的影响因素集训练ELM模型,并用ELM模型对其他测点位移进行预测.验证结果表明,RS-MIV-ELM模型的训练速度、预测精度和泛化能力均比全因素ELM模型和基于最简集的BP神经网络模型RS-MIV-BP具有较大的提高,其均方根误差和平均相对误差仅为全因素ELM模型和RS-MIV-BP模型的1/2~2/3.  相似文献   

6.
提出了一种基于贝叶斯方法的多分类器组合优化算法和阈值改进方法。首先,计算分类器对各个类别的置信度。然后,以各分类器的置信度为先验概率,采用向量求和将各分类器的先验概率向量进行组合,得出最终输出向量,最后通过优化阈值提高综合分类器识别精度。在此后的实验数据表明:该算法具有方法简单、运算速度快、分类精度高等优点。  相似文献   

7.
为实现对粘连细胞图像的分割,将Bayes分类器和KNN分类器引入到水平集外部速度函数的设计中,两种分类器轮流作用,无需设定阈值便能产生水平集驱动力.算法将Shi模型的双链表和C-V模型的全局分割相结合,以加快曲线演化.将目标与背景的类内平均距离引入到OTSU阈值法的阈值选择函数中,对OTSU法进行了改进.试验结果表明,相较于水平集法和阈值法,该算法对复杂粘连细胞的分割效果更好,在细胞图像分割中具备一定的有效性和可行性.  相似文献   

8.
广义邻域粗集下的集成特征选择及其选择性集成算法   总被引:1,自引:1,他引:0  
针对实际模式识别系统中样本特征常具有的连续值属性、高维性、强相关性和冗余性等影响分类效果的问题,在广义邻域粗集模型下提出一种集成特征选择及其选择性集成算法.该算法先提取样本特征并利用所提出的马氏距离分布熵评估其重要度,再基于特征重要度构建广义邻域粗集模型,并在此模型上以特征重要度为启发式信息设计基于蚁群算法的属性约简算法,然后通过改变广义邻域粗集模型参数的方式获得更多具有更大差异性的基分类器,最后利用主成分分析法对产生的基分类器进行选择性集成.模拟电路故障诊断结果表明,该算法比AdaBoost等算法取得的分类精度至少提高了2.6%.  相似文献   

9.
光伏发电功率受自然环境因素影响较大,具有很强的随机性和波动性,准确及时的光伏发电功率预测对电网的调度运行具有重要的意义.提出了一种基于PSO与ELM组合算法的短期光伏发电功率预测模型.该模型通过调整粒子群优化算法(particle swarm optimization,PSO)不同阶段的寻优重点,为极限学习机(extreme learning machine,ELM)设定出了最佳网络参数,避免了ELM随机产生输入层权值和隐含层阈值造成的网络不稳定问题.同时结合传统神经网络和ELM网络隐含层节点选取原则为组合模型,设定了最佳隐含层节点数,提高了模型预测精度.实际算例验证了组合算法模型能够有效提高短期光伏发电功率预测的预测精度.  相似文献   

10.
爆炸作用下RC柱损伤快速评估模型   总被引:1,自引:0,他引:1  
基于BP神经网络,以7个结构参数和2个荷载参数作为输入,损伤值作为输出,建立了爆炸作用下钢筋混凝土(RC)柱损伤的快速评估模型.在模型中,采用以精细化有限元模拟得到的1,032组RC柱损伤的数据训练网络,采用遗传算法和粒子群算法优化网络的初始权值和阈值,并以216个新损伤样本对模型的预测能力进行测试.研究表明,所建立的评估模型能够较准确地用于爆炸作用下RC柱损伤的快速评估;所得到的损伤分区图可以有效并直观地用于RC柱的爆炸风险评估.  相似文献   

11.
为获得改进的分类算法BP_Adaboost,利用思维进化算法(MEA)和列文伯格-马夸尔特算法(LM)结合改进的BP神经网络作为弱分类器,由改进的弱分类器集成得到MEA-LM-BP_Adaboost算法.提出了基于MEA-LM-BP_Adaboost算法的首轮融资时总票房分类预测方法,该方法包括变量选取及操作化处理、网络参数优化、MEA改进弱分类器、LM算法改进弱分类器、MEA-LM-BP_Adaboost算法的流程设计、待预测电影验证6个部分.选用2013~2018年的245部国产电影作为样本验证该预测方法和模型,测试集分类准确率可达73.3%.最后在模型准确率、稳定性、K折交叉验证3方面进行模型整体性能比较,结果表明本文提出的模型整体性能最好.  相似文献   

12.
针对在线Boosting由于提前设定弱分类器个数导致分类器的分类复杂度受到限制的缺陷,提出了一种新的具有动态级联结构的在线Boosting算法.该算法不但具有一般级联结构的特点,而且能根据输入样本分类的难度来实时地调整级联结构的层数,从而使得目标检测器在检测速度和检测精度方面达到很好的平衡.与一般的方法不同,该算法并没有记录一段短暂的历史样本片段来确定弱分类器的阈值,而是把每一个弱分类器的输出值视为一个随机变量,从而进一步估计它的密度函数.然后以迭代的方式估计出整个强分类器的密度函数,进而构建出在线Boosting的动态级联结构.实验结果表明:与原始的在线Boosting算法相比,该算法大大提高了目标检测的速度和精度.  相似文献   

13.
提出了一种基于椭圆肤色模型与可控风险敏感型Adaboost(CCS-Adaboost)算法的多视角人脸检测方法.在人脸检测的离线训练部分,该方法使用Haar-like特征和CCS-Adaboost算法训练样本.CCS-Adaboost在最小化分类错误率的同时能够最小化样本的误分类风险,从而它能够提高分类准确性.在实时检测部分,首先通过使用YCbCr颜色空间的椭圆模型快速检测出可能的人脸区域,然后通过基于CCS-Adaboost的多视角人脸检测器检测人脸.多视角人脸检测器中级联分类器的前四层构成姿态预估部分,如果样本未通过级联检测器的前四层,那么该样本被确定为一个非人脸样本.实验证明该检测器可以有效和准确地检测多视角人脸.  相似文献   

14.
针对SVDD处理大数据样本时存在时间复杂度较大的问题,提出一种随机蚕食快速增量式支持向量域数据描述(RGInc-SVDD)算法.RGInc-SVDD首先利用随机抽样定理将样本训练集分割为多个子集,然后将其中一子集用于建模Inc-SVDDi分类器,最后利用迭代蚕食算法合并增长Inc-SVDDi分类器,以生成整个训练集的SVDD分类器.RGInc-SVDD算法使得SVDD的时间复杂度从O(N3)降到O(N2r/Gn2).实验结果验证了RGInc-SVDD算法的正确性和有效性.  相似文献   

15.
为了探索基于样本数据的煤矿瓦斯爆炸风险预测,依据本质安全理念构建了预测瓦斯爆炸风险的指标集,结合机器学习与特征优化算法提出了信息增益(information gain,IG)与支持向量机(support vector machine,SVM)的组合模型,通过对优化后的14种特征信息的分类学习,完成对风险未知样本的预测任务.以全国100家煤矿企业为研究对象,使用不同模型分别预测瓦斯爆炸风险并全面分析和比较,实验结果表明,经过IG优化后的SVM模型预测正确率达到了95.45%,相对于单一SVM模型提高了9.09%,同时高于其他预测模型,证明了该组合模型在瓦斯爆炸风险预测领域的优越性.  相似文献   

16.
针对船舶交通流时间序列的非线性和非平稳性特点,设计一种结合集合经验模态分解(ensemble empirical mode decomposition,EEMD)和差分进化算法优化BP神经网络(back propagation neural network optimized with differential evolution algorithm,DEBPNN)的船舶交通流组合预测模型(EEMD-DEBPNN).首先,利用EEMD算法降低船舶交通流时间序列的非平稳性;然后,对EEMD分解后获得的各非线性分量采用DEBPNN模型(先采用DE算法对BPNN的初始权值和阈值进行预寻优,再利用预寻优获得的初始权值和阈值训练BP神经网络得到最优的权值和阈值)进行预测;最后,再将各分量预测值进行叠加即得到最终预测结果.基于长江某港口航道船舶月交通流数据,将该组合模型与BPNN、DEBPNN模型进行实例对比分析.结果表明,EEMD-DEBPNN较DEBPNN、BPNN模型的预测精度更高.  相似文献   

17.
在计算机辅助诊断系统中使用集成分类器是提高机器识别能力的一种重要途径。针对集成分类器投票组合算法中存在的投票可信度问题,提出了一种基于Grading的集成分类器组合算法EGR,该算法根据集成分类器对样本的预测结果是否正确来转换相应样本的类标签,用新数据构造元分类器。在UCI医学数据集上进行的实验结果显示,EGR算法对分类精度的提升以及敏感性与特异性的整体改善是有效的。  相似文献   

18.
提出一种基于样本分布的极限学习机预测模型WELMSD.该模型先用kN近邻密度估计方法估计出样本的密度值,再用估计出的密度值给传统ELM的经验风险项加权,克服传统ELM在对时间序列进行预测时忽略样本分布的缺点.基于Rossler混沌时间序列和上证、深证股票数据的实验仿真结果证明了所提算法的有效性,且当近邻参数k_N取值较小时,所提模型对参数不敏感,是一种更优的多变量时间序列预测模型.  相似文献   

19.
经典支持向量机算法具有较高的时空复杂度,这导致其很难广泛被应用.为此,该文基于支持向量分布的先验知识,把KNN算法和10折交叉验证方法结合起来,提出了一个支持向量预选取算法.该算法从原始样本集中选取k个邻近样本,并计算出这k个邻近样本中异类样本所占比例,如果该比例超过了所给定的阈值q,就选择这些异类样本作为预取的支持向量.在此过程中,采用10折交叉验证法来确定k与q的最佳值.两组仿真实验表明所提算法选择出的支持向量而形成的分类器分类准确率更高而且耗时还较少.  相似文献   

20.
汪森辉  王成  孙坤  何祥  杨科 《科学技术与工程》2023,23(13):5530-5538
针对自适应增强回归阈值(adaptive boosting regression threshold, AdaBoost.RT)算法用于判断训练样本好坏的阈值为常数,不能自适应地对每个测试样本动态调整判断标准的问题,提出了一种动态自适应调整阈值的改进AdaBoost.RT算法。通过引入训练结果的均值与标准差构造奇异系数作为判断相对误差的阈值,实现算法训练计算过程中阈值的自适应调整,在提高预测精度的同时,可以减少选择算法参数带来的繁重工作量。采用4组经典测试函数构造不同规模的训练样本数据进行算法检验,实验结果表明,提出的自适应调整阈值算法可以有效利用测试样本之间的差异性,克服了大噪声数据带来的干扰,改进后的集成算法可以改善回归模型的预测效果,提高模型的泛化性能。利用IEEE PHM 2012数据集验证所提方法的有效性,并与极限学习机(extreme learning machine, ELM)和原始AdaBoost.RT算法进行对比分析。结果表明:采用所提方法获得的轴承寿命预测均方根误差降低了5.18%,决定系数提高了3.11%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号