首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到12条相似文献,搜索用时 62 毫秒
1.
基于新型集成分类器的非平衡数据分类关键问题研究   总被引:2,自引:0,他引:2  
针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm, DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier, SREC)。SREC采用独特的分类器选择策略、分类器集成策略、分类决策方案,可获得较高的分类精度。同时,利用SREC对影响非平衡数据分类的关键问题进行了研究。结果表明,非平衡数据分类问题本质上是由正负样本类间非平衡、类内非平衡、样本规模以及样本非平衡度等诸多因素引起的,只有综合考虑这些因素才能更好地解决非平衡数据分类问题。  相似文献   

2.
针对复杂产品多属性、高维度的特点,引入LASSO方法对其关键质量特性进行识别。首先利用LASSO方法的特征选择能力降低原始数据集的维度,并获得原始数据集中质量属性同质量类别相关性的排序;根据要求数量选取属性组成关键质量特性属性子集,利用SVM测试所选取属性子集的分类精度,并同已有文献结果进行对比。以UCI数据库中SECOM数据集为例,采用SMOTE过抽样和随机欠抽样相结合的方法使数据均衡后进行测试。结果表明,该方法不仅能够消除高维原数据集中不相关和冗余属性,还能保持良好的分类质量。同IG和ReliefF等方法相比,文中方法所获得的关键质量特性的分类精度有显著提高,并且第二类错误率也明显低于前两种方法。  相似文献   

3.
为了提高复杂产品高维不平衡质量特性数据集关键质量特征识别效率,提出CEM-IG 识别方法. 通过调整CEM (classification EM algorithm)算法的K值输出不同的聚类结果,消除冗余样本后作为IG (information gain)算法的输入,并以IG 作为判别质量特性重要程度的标准构建识别模型,最终输出最优关键质量特性集. 算例结果表明,该方法将CEM 的缺失值处理能力和IG 的不相关特性筛选能力优势互补,能够有效降低不平衡和高维度带来的负面影响,正确识别产品关键质量特性.  相似文献   

4.
针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法。首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本。然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除。通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率。实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一定的应用价值。  相似文献   

5.
针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法。首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本。然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除。通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率。实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一定的应用价值。  相似文献   

6.
环境应力筛选依据环境试验标准规定的试验条件和程序开展试验,剔除失效产品,使产品尽快度过早期失效期。针对当前高可靠的制造背景下在筛选过程中发现的失效产品数量少、效费比低的问题,提出了一种环境应力筛选方案设计流程。首先,基于应力-强度干涉模型明晰了筛选的基本原理,分析了筛选应力及强度分散性对筛选效果的影响;其次,结合关键质量特性的识别与测量、分散性分析,制定了筛选方案的设计流程;最后,以某天线罩的筛选为例验证了所提方法的有效性。该方法为提高筛选效率、降低筛选成本提供了思路。  相似文献   

7.
不平衡数据的出现给传统关联分类算法带来了巨大的挑战.为了提高关联分类方法对不平衡数据集的分类精度,本文分别从数据和规则层次着手,提出了关键值抽样法(key value sampling,KVS)和规则验证法(rule validation,RV).关键值抽样法通过增加与少数类相关性强的数据,减少与多数类相关性弱的数据来达到数据类分布平衡.避免了大量有效信息的流失,并且增强了与少数类相关性强的数据信息.规则验证法对初步生成的分类器进行了规则验证,并对分类性能不好的规则进行调整,从而保证了分类器中规则的质量.实验表明,本文中的研究方法能够有效提高关联分类方法处理不平衡数据的精度.  相似文献   

8.
在定义了制造企业生产制造时间序列的基础上,使用G-P算法计算时间序列的关联维数。通过关联维数的计算得到相应的嵌入维数后,使用基于相空间重构的小数据量法计算混沌时间序列的Lyapunov指数。采集HZ近三年的日生产产品合格率作为研究制造质量水平变化混沌特性的原始数据。在以上技术路线及数据的基础上,得到的关联维为分数,而Lyapunov指数为正值,说明日生产产品合格率变化时间序列呈现出混沌特性。另外将以上数据分为8个时间序列,每个时间序列同样得到分数关联维数与正Lyapunov指数,说明制造质量水平的变化是一直是混沌的,为制造质量水平的预测在理论上提供了可能性。  相似文献   

9.
针对传感器精度下降时的航迹关联问题, 提出了一种基于数据质量评估的自适应序贯航迹关联算法。将实时数据质量评估结果引入关联门限的调整, 结合熵值法和效用函数法对传感器性能和局部滤波质量两项指标分别进行评估, 构建了两项指标与算法显著性水平之间的模糊关系, 实现关联门限的自适应调整。仿真表明, 在局部传感器精度下降的场景下, 改进算法的关联性能优于对比算法, 且良好的关联效果有益于融合精度的提升, 在目标机动的情况下也具有良好的适应性。  相似文献   

10.
实际过程中,监控指标值往往不满足确定的概率分布,给控制限的计算带来了困难,现有的计算方法计算复杂、精度差.根据高维空间良好的分类特性,提出一种基于核主元分析(KPCA)的监控指标控制限计算方法,将监控指标值映射到高维空间,再在高维空间中对其映射数据进行监控,实现了控制限的间接求取,避免了复杂的计算.  相似文献   

11.
武器装备体系贡献率是指单件装备在武器装备体系或作战体系构成中,按照体系的总目标和运行规律,对体系的整体性能(如体系作战能力或作战效能)贡献的大小。首先建立能力效能综合的贡献率评估框架,在此框架下提出层次化的体系贡献率评估思路。然后借助面向关系的质量功能展开量化矩阵方法,将仿真实验中能力/效能度量指标数据映射到需求度量矩阵,再以度量集对需求集的敏感度和拟合优度作为依据,构建度量指标的组合权重。最后,利用逼近理想解排序法对体系方案贡献度进行排序,并以无人集群执行火力打击任务作为算例,验证了该方法的可行性。  相似文献   

12.
ERP(enterprise resource planning,企业资源计划)系统的分步云化是降低ERP云化风险的有效手段,而选择出ERP中优先云化的功能是实现ERP系统分步云化的前提.首先基于信息强度理论,从传统ERP使用角度提出了测量信息强度的指标;然后基于二分网络方法建立用户-功能网络模型,定义了企业业务域的信息绝对强度和信息关联强度,提出了基于信息强度的ERP分步云化的选择方法;最后利用一家大型船舶制造企业ERP日志数据进行了实例分析,验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号