首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
提出一种基于聚类的启发式选择性集成学习算法.集成学习通过组合多个弱分类器获得比单一分类器更好的学习效果,把多个弱分类器提升为一个强分类器.理论上来说弱分类器的个数越多,组合的模型效果越好,但是随着弱分类器的增多,模型的训练时间和复杂度也随之递增.通过聚类的方法去除相似的弱分类器,一方面有效降低模型的复杂度,另一方面选出差异性较大的弱分类器作为候选集合.之后采用启发式的选择性集成算法,对弱分类器进行有效的组合,从而提升模型的分类性能.同时采用并行的集成策略,提高集成学习选取最优分类器子集效率,可以有效地减少模型的训练时间.实验结果表明,该算法较传统方法在多项指标上都有着一定的提升.  相似文献   

2.
作为机器学习领域的一个重点研究方向,集成学习相比于单分类器有着更高的检测精度,被广泛应用于异常入侵检测.但是,现有基于集成学习的入侵检测算法在对原问题进行划分过程中会存在一定的边缘信息与整体信息的丢失,且最终的模型融合也是一个耗时、复杂的调整参数过程.基于此,提出一种改进的基于集成学习的入侵检测算法,将原问题转化成多个二分类问题,并把多个分类器的概率预测结果作为先验知识加入到原本的特征中,再进行多分类模型的学习;借助于Facebook提出的梯度提升决策树(GBDT)和逻辑回归(LR)的融合模型对其中的二分类问题进行学习.通过在KDD CUP’99数据集的实验与分析,验证了所提算法的有效性.  相似文献   

3.
陈涛 《科学技术与工程》2012,12(21):5312-5315,5321
针对基于Boosting和Bagging的集成算法不能有效提高"强学习器"泛化性能的问题,融合Boosting的样本扰动和快速核独立分量分析的特征扰动以生成若干个体支持向量分类器,使生成的训练样本集具有较大的差异性。然后基于模糊核聚类算法根据各个体支持向量机在验证集上的泛化误差选择最优个体进行集成。实验结果表明该算法能进一步提高支持向量机分类器的泛化性能,而且具有较强的稳定性。  相似文献   

4.
针对传统集成学习方法运用到木马流量检测中存在对训练样本要求较高、分类精度难以提升、泛化能力差等问题,提出了一种木马流量检测集成分类模型。对木马通信和正常通信反映在流量统计特征上的差别进行区分,提取行为统计特征构建训练集。通过引入均值化的方法对旋转森林算法中的主成分变换进行改进,并采用改进后的旋转森林算法对原始训练样本进行旋转处理,选取朴素贝叶斯、C4.5决策树和支持向量机3种差异性较大的分类算法构建基分类器,采用基于实例动态选择的加权投票策略实现集成并产生木马流量检测规则。实验结果表明:该模型充分利用了不同训练集之间的差异性以及异构分类器之间的互补性,在误报率不超过4.21%时检测率达到了96.30%,提高了木马流量检测的准确度和泛化能力。  相似文献   

5.
为进一步提升图分类算法的性能和稳健性,提出了差分进化算法优化的图注意力网络集成.首先,通过划分原始样本让不同的基学习器关注数据的不同区域;其次,利用差分进化算法良好的搜索能力,以分类器集成的分类错误率为目标函数优化基学习器的权重向量;最后,在权重向量基础上综合各基学习器的输出作为分类器集成的总体输出.实验引入引文数据集...  相似文献   

6.
针对当前软件缺陷序列预测算法准确度不高的问题,提出了基于非线性加权的集成学习软件缺陷序列预测算法(NLWEPrediction)。该算法在常见线性集成预测算法的基础上增加了非线性回归项,回归项代表了集成预测算法中基预测算法之间的相互关系,修正了线性集成预测的偏差,并通过梯度下降法求解了模型中的参数。实验表明:NLWEPrediction在14个软件缺陷数据集上的均方误差均小于250,并且平均绝对误差均小于13。通过与基预测算法、集成预测Bagging、Stacking算法和只考虑两个分类器关系的非线性加权集成学习算法进行对比,可以看出,NLWEPrediction预测算法的均方误差和平均绝对误差显著减小,预测精度显著提高,说明在线性集成预测算法基础上增加非线性回归项,能够有效提高集成学习算法的分类效果。  相似文献   

7.
柳炳祥 《科学技术与工程》2013,13(19):5536-5542
提出了一种新的基于双重采样的选择性集成学习算法。针对集成学习要求学习器个体的差异性分布在样本空间的不同部分,对得到的聚类个体学习器输出进行重采样,以此来计算聚类个体的差异性。针对集成学习要求得到的个体学习器具有一定的精确性,对所有得到的学习器个体集合进行重采样来评估聚类个体精确性。在此基础上选择出集成学习所需的个体集合。以谱聚类算法作为基学习器,用聚类集成策略部分解决了谱聚类算法存在的尺度参数敏感问题,在UCI数据集上的仿真实验验证了算法的有效性。  相似文献   

8.
在AdaBoost集成方法的基础上,研究了一种产生式与判别式模型组合的方法。该算法在每轮中同时学习一个产生式分类器和一个判别式分类器,选择误差率较小的作为个体分类器,然后对所有个体分类器采用加权的方法得到最终分类器。实验结果表明,该方法在准确率和收敛速度上都具有很好的效果。  相似文献   

9.
改进的集成神经网络学习优化研究   总被引:1,自引:0,他引:1  
AdaBoosting算法是一种集成学习算法,用来提高不稳定学习器的泛化能力.本文基于神经网络是一种不稳定分类器的机理结合最小二乘算法和遗传算法,提出了对集成神经网络分类器权值进行优化的新方法.  相似文献   

10.
本研究提出基于妊娠早期体检、基因信息,结合集成学习的妊娠期糖尿病预测分类方法.设计了基于Stacking框架的改进模型ACS-Stacking.ACS-Stacking模型将基分类器输出的类别概率值作为基层输出结果,元层使用GBDT模型学习组合基层输出的类别概率结果,拓展了算法的层次结构.在基分类器层与元分类器层之间加入基分类器筛选层,通过CFS算法估计不同分类器集合中个体分类器准确性与多样性的权衡值,筛选出最佳基分类器集合,实现基分类器的自适应选择.研究结果表明,该模型F1值较单一模型提高约9%,较Stacking模型提高约7%,具有较好的预测准确性和稳定性.  相似文献   

11.
为探究覆冰条件下旋转风力机叶片振动特性,分析温度、湿度、风速、运行时间四个因素对覆冰叶片振动特性的影响,以1:12.5建立的实体风力机模型为研究对象,搭建旋转风力机叶片覆冰振动测试试验台,设计四因素三水平正交试验,采用环境激励(风激励)和多点拾振的方法进行模态测试。试验研究了不同覆冰状态下旋转风力机叶片的振动特性及其变化规律;以最大振动频率为评价指标,分析四个因素对覆冰风力机叶片振动特性的影响。结果表明:相同覆冰条件下,覆冰厚度不变,旋转风力机叶片振动频率由叶尖至叶根逐渐减小;覆冰位置不变,覆冰厚度增加,旋转风力机叶片振动频率逐渐降低;旋转风力机叶片运行环境温度和湿度变化对其振动频率的影响较大。为进一步分析覆冰条件下旋转风力机叶片的位移响应和振型变化,建立了风力机三维模型,利用ANSYS软件对其进行谐响应分析,分析结果显示不同覆冰状态下叶片振型变化无明显差异,覆冰厚度增加,叶片位移响应值明显增大。研究结果可为覆冰条件下风力机运维策略选择及叶片覆冰安全监测提供理论参考。  相似文献   

12.
商品预测是使用以往商品信息去估计和推断未来商品的销售趋势,并以此作为对商品进行合理调配与规划的依据.为实现对商品销售的精确预测,在GBDT基础上,提出了一种层次化集成预测模型(HGBDT).针对数据表征的高维问题,基于Bagging思想,在特征空间构建了该模型,实现对商品的有效描述,以此提高预测模型的性能与泛化能力.在开放数据库上的实验结果验证了本文模型的有效性.  相似文献   

13.
唐中君  吴凡  倪浪 《科技促进发展》2020,16(10):1221-1229
电影首映日票房预测对该日排片、后续放映日票房及总票房有显著影响。在构建考虑竞争的电影首映日票房预测变量集的基础上,建立首映日票房集成预测模型。首先使用多元线性回归(multiple linear regression, MLR)、支持向量回归(support vector regression, SVR)、套索回归(Least absolute shrinkage and selection operator, Lasso)和极端梯度提升(Extreme Gradient Boosting, XGBoost)等算法建立基学习器,随后使用XGBoost算法作为原学习器构建堆栈集成预测模型,最后利用收集到的数据进行对比实验。实验证明,加入竞争变量的电影首映日票房预测变量集适用于首映日票房预测;相比单一模型,提出的集成预测模型的准确性、泛化性能和稳定性均有提升,相比较传统预测方法对首映日票房预测更准确。提出的集成预测模型有助于提升首映日票房排片的有效性。  相似文献   

14.
Boosting是机器学习领域中重要的集成学习方法,以AdaBoost为代表的Boosting算法通过在组合弱学习器时不断加强对错分类样本的关注以构建性能优异的强学习器,而该训练机制对噪声点的无差别对待易引发学习器对噪声过拟合,从而削弱算法的稳健性.针对该问题,提出结合加权KNN和自适应牛顿法的稳健Boosting方法.该方法首先通过加权KNN估计样本的噪声先验概率,然后使用噪声先验概率修正Logit损失构建一种新的损失函数,最后采用自适应牛顿法进行损失函数的优化求解.提出方法引导分类器在给予错分类样本更高权重的同时,对噪声先验概率大的样本给予相应的惩罚,使噪声样本的权重得到有效的缩减.结果表明,与其他稳健Boosting方法对比,在不同噪声水平下以及真实的医疗数据集的不同评价指标下,该方法表现出更好的稳健性,具有明显的应用价值.   相似文献   

15.
适用于寒冷气候条件的风力发电机研究已成为可再生能源领域广为重视的方向。针对环境因素、翼型、风机型号和运行状态等多因素协同作用下的叶片覆冰特性,依据能量分配理论和叶片表面温升特性,论述了主动防冰除冰技术的结构、热载荷分布以及能量传递方式。被动防冰除冰技术中,具有水滴自去除效应的涂层优势显著,依据涂层的防冰机理、导热导电性和化学稳定性等方面,论证其应用在风力发电机叶片上的可行性。最后,防冰涂层与电加热结合构成的复合防冰除冰结构,能够有效降低能耗、减少回流水结冰,但在涂层表面润湿性转变、导热率和耐久性等方面的研究尚存在一定的争议,将是未来主要的研究方向。  相似文献   

16.
针对极端天气导致风电机组频繁故障,提出了一种基于改进贝叶斯网络的风电机组故障诊断与风险预测模型。该模型计及气象因素与风机故障之间的关联,利用ReliefF算法计算故障特征权重,得到最优特征集合;建立计及气象因素的基于贝叶斯网络的风电机组故障诊断与风险预测模型,利用正向诊断技术得到故障诊断策略,并通过反向推理技术对风险事件进行预测。将文中提出的模型进行受试者工作特性曲线(receiver operating characteristic curve, ROC)验证,结果表明所提模型ROC曲线下面积(Area Under Curve, AUC)为0.9049,验证了所提模型的有效性,可以为风电机组故障诊断和风险预测提供有效依据。  相似文献   

17.
为增强大型风力机叶片抑颤效果,从增加叶片的结构阻尼角度出发,以8MW风力机叶片为研究对象,通过铺层设计和阻尼层位置设计为建立阻尼叶片有限元模型提供基础.分别以SHELL181单元和SOLID185单元模拟叶片上下蒙皮和阻尼层,对无阻尼叶片和阻尼叶片两种模型进行模态分析,探究阻尼层厚度变化对原叶片整体质量、固有频率及结构...  相似文献   

18.
风机叶片引下线出现断裂故障,将直接威胁风机的安全运行,然而当前关于叶片引下线断裂故障的检测与定位研究较少。为此,选取2.5 MW真机叶片引下线,并考虑其分支结构,以注入脉冲法为故障检测和定位手段,搭建了叶片引下线断裂故障仿真模型和实验平台,从仿真和实验角度开展叶片引下线断裂故障检测与定位方法研究。研究结果表明,含分支结构的叶片引下线发生断裂故障时,仅凭故障波形难以实现故障检测与定位,可通过对故障波形与无故障波形作差找到故障反射波,依据故障反射波完成叶片引下线断裂故障的检测与定位。所提方法具有较强的可行性和有效性,为当前风电场诊断叶片引下线断裂故障提供了新思路。  相似文献   

19.
针对风力机叶片表面出现的磨损等早期损伤特征现象,传统损伤检测方法存在高成本低效率等问题,设计了一种基于机器视觉和图像处理相结合的风力机叶片损伤检测系统。通过搭建机器视觉实验平台完成风力机损伤叶片图像采集和处理,通过使用HSV进行颜色平面提取,卷积运算、高亮显示操作滤波,选用自动阈值分割方法中最小均匀性度量法进行阈值分割处理,最后通过数学形态学去噪处理,腐蚀、膨胀、开运算等操作完成特征提取,设计了基于LabVIEW的风力机叶片智能图像识别系统,通过对图像处理后的损伤特征识别效果调试,完成性能测试。实验结果表明:基于该算法处理后的图像在设计的识别系统内准确识别率达到92.3%,并对裂纹损伤进行目标测量得到实际长度且绝对误差最大为3 mm。该系统满足叶片检损的要求,实现对风力机叶片表面裂纹、轮廓磨损等损伤的图像处理和识别,并对损伤处进行标记、计数和测量,实现无损探伤,为兆瓦级风力机叶片损伤检测提供方法借鉴和图像处理、系统设计的技术支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号