首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
在单类支持向量数据描述算法的基础上, 提出了一种基于局部支持向量数据描述的稀有类分析算法: LSVDD, 能够处理存在类重叠的类不平衡问题. 该算法利用支持向量数据描述算法对各类样本分别进行单类学习, 从而获得单类模型; 然后对单类模型的概念重叠区域使用属性选择进一步进行局部单类学习, 最后得到综合分类模型. 在仿真数据集和UCI数据集上的实验结果表明, LSVDD能够有效和稳定地提高稀有类分析精度.  相似文献   

2.
针对Rough集中刻画属性分类能力的测度正区域等仅能反映属性可辨识对象集大小,不能反映属性对样本的划分状况影响分类的其它因素的问题,提出了Rough集中度量属性分类贡献能力的综合测度———属性分类粗糙度,对其特性进行了分析,给出了用该测度以及信息增益等分别作为决策树算法选择属性的启发式对UCI几个数据集的挖掘结果.理论分析和实验表明,属性分类粗糙度更全面地刻画了属性对分类的综合贡献能力,且具有计算更为简单等特点.  相似文献   

3.
针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法。首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本。然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除。通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率。实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一定的应用价值。  相似文献   

4.
针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法。首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本。然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除。通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率。实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一定的应用价值。  相似文献   

5.
针对多类别不均衡数据的分类问题,从数据集的特征选择和集成学习两个角度出发,提出了一种新的针对不均衡数据的分类方法—BPSO-Adaboost-KNN算法,算法采用基于多分类问题的可视化的AUCarea作为分类评价指标.为了测试算法的性能,本文选取了10组UCI和KEEL选取的测试数据集进行测试,结果表明本算法在有效提取关键特征后提高了Adaboost的稳定性,在十组数据的分类精度上相比单纯使用KNN分类器有20%~40%不等的提高.在本算法和其他state-of-the-art集成分类算法对比中,BPSO-Adaboost-KNN能够取得较优或相当的结果.最后,本文将该算法应用到石油储层含油性的识别中,成功提取了声波、孔隙度和含油饱和度三个关键属性,在分类精度上相比传统分类算法有了大幅度提高,在江汉油田五口油井oilsk81~oilsk85上的分类精度均达到98%以上,比单纯使用KNN的精度高出了20%,尤其在最易错分的油层和差油层中有良好的分类效果.  相似文献   

6.
视频语义分类特征选择算法   总被引:2,自引:1,他引:2  
提出一种将连续特征数字量化后进行特征选择的算法(ABFSA)。利用样本集中的先验信息选择出特征值域中最具类间区分意义的区域,将其作为完整量化区间。采用向后式的启发搜索策略,搜索合并后能使贝叶斯分类错误率降低的相邻量化区间。合并搜索得到的两相邻量化区间,量化的级数降低一阶。重复搜索和合并过程,直至贝叶斯分类错误率不再降低为止。所有特征搜索、合并完成后,总的特征量化阶数得到大幅降低。用UCI仿真数据集及真实视频数据进行实验,对比结果表明该算法能有效选取视频语义概念分类的重要特征,其综合性能较优。  相似文献   

7.
2v-SSPC-一种不平衡数据分类方法   总被引:2,自引:0,他引:2  
针对现有分类算法通常对不平衡数据挖掘表现出有偏性,即正类样本(通常是更重要的一类)的分类和预测性能差于负类样本的分类和预测性能,提出一种不平衡数据分类方法。该方法通过一个超球面将两类数据以最大分离比率分离,并且引入两个参数来分别控制两类错分率的上界,不仅提高了不平衡数据集的分类和预测的性能,而且大大缩小了参数的选择范围。在UCI真实数据上进行了实验,并采用ROC曲线下面积作为评估指标进行比较,结果验证了该方法的有效性。  相似文献   

8.
针对现有基于机器学习的雷达有源干扰分类大多需要构建人工特征集且小样本情况下分类精度低的问题, 提出一种基于多通道特征融合的集成卷积神经网络(convolutional neural network, CNN)分类方法。首先, 建立多种有源干扰的数学模型, 仿真并利用短时傅里叶变换获得其时频分布图; 其次, 提取时频分布图的实部、虚部和模值三通道特征, 通过多种特征组合方式建立不同特征组合的样本集; 最终, 构建以CNN为基分类器的集成深度学习模型, 每个CNN分别提取不同样本集的特征, 对所有基分类器的预测结果做多数投票得到集成模型的整体预测结果。实验表明, 该方法能够有效实现小样本情况下多类有源干扰的高精度智能化识别。  相似文献   

9.
针对现有入侵流量检测模型分类准确率低、小样本特征提取不足等问题, 提出了一种基于自适应合成采样和Inception-Resnet模块的改进残差网络算法。该算法能够对不平衡数据集进行采样优化, 有效提升模型的小样本特征提取能力。首先, 通过对不平衡的数据训练集进行过采样改善数据分布, 然后对非数据部分进行独热编码处理并与数据部分整合, 降低预处理复杂度, 最后利用改进残差网络模型进行数据训练, 并进行性能评估和算法效能对比。实验结果表明, 改进残差网络模型对入侵流量的检测准确率在多分类和二分类情况下分别达到89.40%和91.88%。相比于经典深度学习算法, 改进残差网络模型的准确率更高, 误报率更低, 具备较高的可靠性和工程应用价值。  相似文献   

10.
基于全方位优化算法的改进马田系统分类方法   总被引:1,自引:0,他引:1  
针对马田系统的若干不足, 提出一种改进的马田系统优化模型, 其核心思想是 根据分类问题的目的和特点提出若干优化目标, 采用优化模型替代正交表和信噪比筛选关键变量. 针对模型的特点, 采用了一种全方位优化算法进行求解. 通过对4个 UCI数据集的算例分析表明, 该方法不仅有较好的分类精度, 且能筛选关键变量, 降维效果明显. 最后对一个实际生产案例 进行了研究, 结果表明该方法在保持高分类效率的情况下, 能够显著减少质量检测变量, 降低成本, 提高生产效率.  相似文献   

11.
为了进一步拓宽度量学习在图像分类中的适用范围,同时提高分类的性能,本文提出一种基于椭圆双曲线马氏度量的图像分类算法。该算法首先将颜色特征和局部二值模式描述的纹理特征相结合来表示图像特征;然后引入对样本数据具有更好的适应性的椭圆双曲线度量,根据数据统计特性定义椭圆双曲线马氏度量,给出椭圆双曲线马氏度量学习算法,从而获取最优的度量矩阵;最后利用椭圆双曲线马氏度量矩阵将样本变换到新的特征空间,从而降低特征各维度间的相关性,同时计算图像特征间的距离从而完成分类。实验表明该算法提高了图像分类的有效性。  相似文献   

12.
针对有标签样本较少条件下的通信信号调制识别问题, 提出一种基于集成学习与特征降维的小样本调制方式分类模型。首先,通过集成人工特征与深度学习自动提取特征构成特征集合。然后,设计特征选择算法对特征合集进行优选生成高效特征子集。最后, 利用可快速收敛的高性能分类器对信号进行区分, 实现在少量有标签样本和大量无标签样本条件下的调制方式分类。仿真结果表明, 通过对8种数字信号进行调制识别, 在信噪比为20 dB时, 所提算法可将信号最高识别率提升至96%, 同时该算法设计简单, 具有较大应用价值。  相似文献   

13.
在分析了Kohonen自组织特征映射网络(SOFM)和学习矢量量化(LVQ)算法的基础上,提出一种基于改进的SOFM算法和LVQ2算法的混合学习矢量量化(HLVQ)方法,并建立了基于HLVQ的遥感影像非监督和监督分类的一般模型。通过与传统的统计分类方法和LVQ2网络分类器比较,HLVQ分类器总的分类性能更好、识别率更高。  相似文献   

14.
针对多数传统分类算法应用于高光谱分类都存在运算速度慢、精度比较低和难以收敛等问题,从稀疏表示基本理论出发建立了一个基于自适应稀疏表示的高光谱分类模型。利用训练样本构建字典,聚类每一步迭代所产生的余项,将聚类中心作为新的字典原子,然后将测试样本看成冗余字典中训练样本的线性组合,令字典能够更适应于样本的稀疏表示。利用华盛顿地区的HYDICE高光谱遥感数据进行试验,并且与主成分分析、线性鉴别分析、支持向量机、神经网络算法进行比较,结果表明,该算法的总体分类精度比其他算法提高了约12%,有效提高了高光谱影像的分类精度。  相似文献   

15.
张大鹏  闻佳  刘曦 《系统仿真学报》2012,24(9):1826-1830
提出一种快速且有效的半监督多标签学习方法:模型共享半监督推举。该方法能发现、共享并组合多个基模型,每个基模型是在某个标签上利用半监督支持向量机(S3VM)上学习的。通过使用模型共享,标签关联被显示地利用且对于每个标签来说只需要少量的基模型即可生成最后的决策结果。在Corel5k和Mediamill数据集上评估方法,实验结果显示的方法与当前流行的监督和半监督多标签学习方法是可比的。  相似文献   

16.
由于传统主动学习方法的计算量随着问题规模的增大呈指数增长, 因此很难应用于大规模多类数据分类任务中。为解决该问题, 设计了一种基于子抽样的主动学习(subsampling-based active learning, SBAL)算法。该算法将无监督聚类算法与传统主动学习方法整合, 在二者之间增加了子抽样操作, 该操作能够显著降低算法的时间复杂度, 在保证实验准确率的基础上减少实验耗时, 从而更加高效地处理大规模数据集的分类问题。实验结果显示, 采用SBAL算法的实验性能优于传统主动学习算法, 证明了所提算法可以突破传统主动学习方法不能处理大规模数据集多类别分类问题的局限性。  相似文献   

17.
基于新的决策规则的球形支持向量机分类算法   总被引:2,自引:0,他引:2  
球形支持向量机是一种学习算法,它通过在高维特征空间中,对每一个模式类别构造一个覆盖其所有训练样本的具有最小体积的超球体,来实现对训练样本空间的划分.在此基础上,提出了一种基于新的决策规则的球形支持向量机算法,并在七个UCI数据集上进行了实验,实验结果表明提出的算法可以取得比标准的支持向量机算法更好的分类效果.  相似文献   

18.
毫米波通信的信道估计给系统带来较大负荷。为降低系统开销,联合无线信道低秩和稀疏特征,提出一种基于非凸低秩逼近的信道估计算法框架。针对基于信道建模的字典学习方法运算量大的问题,设计了基于深度神经网络信道特征分类的字典学习算法。仿真表明:在特定城市微蜂窝信道模型下,该方法的均方误差性能均优于基于信道模型的字典学习方法、贝叶斯框架下的信道估计方法以及基于压缩感知信道估计方法;获取相同归一化均方误差时本文算法所需的信噪比最低;所需导频数量低于上述3种方法。  相似文献   

19.
针对信用分类数据集中常见的高维性特征,本文基于特征袋装法和关联规则挖掘算法,构建了新的赋权特征选择集成模型AR-WSAB.该模型能根据频繁项集的支持度和置信度,对各特征的重要度进行测度,进而选择出各特征子集,训练子分类器,再通过集成得到最终结果.通过在贷款违约预测数据集上进行实证分析,结果表明该模型分类正确率相对于Bagging集成模型和PCA算法都有显著优势,所提方法能够有效处理高维性特征,并且在各分类算法上都具有普适性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号