首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
对连续特征进行有效量化是水下目标分类中有待解决的一个重要问题。本文提出一种加权距离量化方法。该量化方法使用类别相对频率构造了两相邻区间的加权距离,将加权距离作为特征量化标准,在量化过程中,将加权距离最小的相邻区间进行合并,直到满足终止条件为止。文中使用递归最小信息熵、Chi2、加权距离等五种量化算法对27维水下目标的识别特征进行了量化处理,比较了各量化方法的性能。结果表明,使用加权距离量化算法对水下目标的识别特征进行量化处理之后,所产生的量化区间数目较少,量化时间较短,量化数据较好的保持了原数据的分类能力,且量化数据的分类时间也大大缩短。  相似文献   

2.
针对非平衡产品制造数据关键质量特性(critical to quality characteristics,CTQs)识别,提出基于NSGA-Ⅱ的特征选择算法.首先,在分类错误率和特征子集大小基础上,针对数据非平衡性,引入第Ⅱ类错误率度量质量特性子集的重要性.接着,应用多目标进化算法NSGA-Ⅱ最小化以上三个度量标准,得到非支配解集.最后,引入理想点法从非支配解集中选择最佳调和解,得到CTQ集.算例结果表明,所提算法能够得到较高分类精度,同时有效降低第Ⅱ类错误率与CTQ集大小,说明了算法的有效性.  相似文献   

3.
近年来我国石油产量跟不上需求,供需矛盾进一步凸显,导致石油的对外依存度已经连续几年超过警戒线,为了缓解供需矛盾,石油的增储上产是一种有效措施,但精确地识别石油储层成为增储上产的一大难题,而特征选择是精确识别石油储层的有效保障.本文提出了一种增强型自适应差分演化算法,即ESADE算法,在算法中使用了双种群的概念,构造了一个简单的双层差分演化,并且在算法的选择操作中加入模拟退火的思想;接着将ESADE算法作为特征选择的搜索策略,将ReliefF算法、BIF算法、FCBF算法及随机抽选特征算法作为评价准则库,SOM神经网络算法、模糊C均值算法、K均值算法和K近邻算法作为分类器库,得到了一种基于ESADE的特征选择算法.然后将此算法应用于某油田oil81、oil82、oil83、oil84和oil85五口井的测井数据集上进行石油储层的油层、差油层、水层和干层的分类识别,并与未进行特征选择直接进行分类的结果进行比较及相同分类正确率下不同分类算法组合及不同属性选择的比较.实验结果表明与SOM神经网络算法、模糊C均值算法、K均值算法及K近邻算法这四种分类算法相比,基于ESADE的特征选择算法能在利用较少属性的同时提高分类准确率,并能够提供不同的属性和分类算法的最优组合方案.  相似文献   

4.
赵英男  杨静宇 《系统仿真学报》2005,17(9):2236-2238,2259
特征抽取是模式识别中的一个关键问题。丈中提出一种改进的基于Gabor滤波器的特征抽取算法。该算法应用Gabor滤波器的多尺度特性与样本图像进行卷积,将得到的Gabor特征矢量,根据其邻近分量的离散程度进行加权处理。与传统方法相比,该算法可以有效增强离散程度相对较小的特征分量在分类中的作用,分类效果较好;同时充分利用样本图像的统计信息,具有一定的鲁棒性。将该算法应用于车辆检测系统中,数据表明其能有效降低车辆检测的错误率,增强系统的鲁棒性。  相似文献   

5.
一种采用LLE降维和贝叶斯分类的多类标学习算法   总被引:2,自引:0,他引:2  
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。  相似文献   

6.
针对传统LogitBoost算法将正确分类与错误分类平等看待且损失函数不收敛于代价敏感的贝叶斯决策问题.本研究在传统LogitBoost算法的基础上给出了一种基于错分代价改进的LogitBoost算法,并以某移动通讯公司的手机用户数据为基础检验了该算法的有效性,研究发现:与其他同类算法相比考虑错分代价后的LogitBoost算法的分类效果提升较明显;随着错分代价比值的增大,预期风险(同一阈值下)增大;同一错分代价比值下的预期风险,随着错分代价比值的增大表现出先增大后减小的趋势.该结论不仅说明了通过引入错分代价能有效降低模型的预期风险(这使新算法由关注分类错误率最小化转向关注预期风险最小),也为通讯公司提供了分析框架和决策参考.  相似文献   

7.
基于自适应蚁群算法的组合式特征选择算法   总被引:1,自引:0,他引:1  
提出一种基于自适应蚁群算法的组合式特征选择算法.将自适应蚁群算法用于特征选择,以特征作为位置点,采用支持向量机分类器评价特征子集的性能,指导特征进行信息素的计算和更新,为特征与特征子集的选择提供了依据,避免了盲目搜索,使搜索算法能够快速收敛.在8组实际数据集中的实验结果表明,从分类正确率、特征子集大小以及运行时间三个角度考察,该算法具有良好的综合性能.同时,给出了该算法应用在孤立肺结节CT图像的检测和诊断中的分类结果.  相似文献   

8.
基于贝叶斯网络的复杂系统故障预测   总被引:2,自引:0,他引:2  
针对复杂电子系统信号具有不确定性的特点,提出一种基于贝叶斯网络的故障预测模型。该模型通过对连续的信号特征进行量化处理,利用专家知识结合信号建立贝叶斯网络结构;对不同样本采用不同算法来进行网络学习,采用概率推理定量估计信号的区间预测概率,从而建立一个可推理的预测模型。将该方法应用于电源系统进行故障预测,针对不同数据样本进行实验,结果验证具有较高的区间预测率,为复杂系统的故障预测提供了新手段。  相似文献   

9.
针对信用分类数据集中常见的高维性特征,本文基于特征袋装法和关联规则挖掘算法,构建了新的赋权特征选择集成模型AR-WSAB.该模型能根据频繁项集的支持度和置信度,对各特征的重要度进行测度,进而选择出各特征子集,训练子分类器,再通过集成得到最终结果.通过在贷款违约预测数据集上进行实证分析,结果表明该模型分类正确率相对于Bagging集成模型和PCA算法都有显著优势,所提方法能够有效处理高维性特征,并且在各分类算法上都具有普适性.  相似文献   

10.
轮询式多准则特征选择算法的研究   总被引:1,自引:0,他引:1  
特征选择是复杂模式分类系统中重要预处理过程.针对filter模式下遗传算法特征选择精度不高,wrapper模式特征选择时间代价较高的缺点,提出了一种新的特征选择算法.该算法设计了搜索性能较好的链式智能体遗传算法为搜索算法,引入多个评价准则进行轮询式选择.实验将算法与filter模式下多种单准则特征选择算法以及wrapper模式下特征选择算法进行了比较.实验结果表明,此算法具有比filter模式下单评价准则选择精度更高的特点,同时选择时间代价远远低于wrapper此模式下的特征选择算法,因此,该算法可用于设计实用高识别正确率的模式分类系统.  相似文献   

11.
研究基于Boosting的柑桔溃疡病自动识别算法.提出了一种基于特征选择准则的Boosting 学习算法,采用对称交叉熵作为弱分类器的相似度评价.将弱分类器相似度与Boosting学习过程相结合学习出更优化的弱分类器,对溃疡病斑图象进行特征选取和学习,建立了自适应的病斑特征模型,最后利用该模型完成溃疡病自动识别.实验结果表明,这种算法避免了Boosting算法进行特征提取时的缺点,减少了选取结果中的冗余,尤其在进行高维特征选取时,能够提高特征选取速度,使选取的特征更具代表性.  相似文献   

12.
针对有标签样本较少条件下的通信信号调制识别问题, 提出一种基于集成学习与特征降维的小样本调制方式分类模型。首先,通过集成人工特征与深度学习自动提取特征构成特征集合。然后,设计特征选择算法对特征合集进行优选生成高效特征子集。最后, 利用可快速收敛的高性能分类器对信号进行区分, 实现在少量有标签样本和大量无标签样本条件下的调制方式分类。仿真结果表明, 通过对8种数字信号进行调制识别, 在信噪比为20 dB时, 所提算法可将信号最高识别率提升至96%, 同时该算法设计简单, 具有较大应用价值。  相似文献   

13.
采用并行协同进化遗传算法的文本特征选择   总被引:1,自引:1,他引:0  
现有的文本特征选择方法都是串行化的, 应用于海量文本数据集时时间效率较低, 因此利用并行思想来提高文本特征选择的效率, 已成为文本挖掘领域的一个研究热点. 本文将 遗传算法和并行协同进化算法结合起来, 在粗糙集的基础上设计了一个并行协同进化遗传算法 并将该算法用于文本特征选择. 该方法采用遗传算法搜索特征, 利用并行协同进化算法来提高 时间效率, 从而较快地获得较具代表性的特征子集. 实验结果表明该方法是有效的.  相似文献   

14.
针对尿沉渣检测中红白细胞的特征选择问题,提出了结合双向选择的内嵌多准则的改进遗传算法(NMGA)(通过多代进化逐步选中优良特征,在每一代进化中基于多种评价准则进行遗传,分别得出各自的最佳特征子集,然后对其进行"多票投选",得出一个最佳特征子集,然后继续下一代进化,该方法可结合小生境技术共同搜索最佳特征子集。文末采用多个尿沉渣红细胞和白细胞样本进行验证实验,实验结果表明,算法优选的特征集与未进行特征选择和经过普通遗传算法(SGA)特征选择得到的特征集相比,识别率较高,并且优选后的特征子集的特征数较少,明显降低了分类器的维数复杂度。  相似文献   

15.
为了对航空电子设备的测试数据进行有效约简, 去除冗余信息和不相关特征, 基于机器学习领域现有的特征选择算法, 提出了一种元学习框架下的航空电子设备特征选择算法推荐方法。所提方法旨在根据不同航空电子设备测试数据所蕴含的信息, 推荐合适的特征选择算法。首先, 分析了数据集特征的描述方法。然后, 介绍了采用综合度量指数的算法性能评价方法。最后, 给出了特征选择算法推荐方法的框架。使用42个航空电子设备的测试数据和13个过滤型特征选择算法建立了元数据库, 采用留一法进行交叉验证, 推荐命中率达到了90%以上, 推荐性能比例达到97%以上。  相似文献   

16.
基于Markov blanket和互信息的集成特征选择算法   总被引:1,自引:0,他引:1  
针对大量无关和冗余特征的存在可能降低分类器性能的问题,提出一种基于近似Markov blanket和动态互信息的特征选择算法并将其应用于集成学习,进而得到一种集成特征选择算法。该集成特征选择算法运用Bagging方法结合提出的特征选择方法生成基分类器,并引入基分类器差异度进行选择性集成,最后用加权投票法融合所选基分类器的识别结果。通过仿真实验验证算法的有效性,以支持向量机(support vector machine, SVM)为分类器,在公共数据集UCI上进行试验,并与单SVM及经典的Bagging集成算法和特征Bagging集成算法进行对比。实验结果显示,该方法可获得较高的分类精度。  相似文献   

17.
在高维数据分析中,一个不可避免且棘手的问题是维度诅咒,因而如何将高维数据通过特征选择降维为低维数据显得尤为重要。对此, 提出了基于鲁棒矩阵分解和自适应图的无监督特征选择模型(unsupervised feature selection model based on robust matrix factorization and adaptive graph, MFAGFS), 实现在一个统一的学习框架下执行鲁棒矩阵分解、特征选择以及局部结构学习。模型首先通过鲁棒矩阵分解可获得聚类标签, 将聚类标签和局部结构信息用来引导特征选择过程, 再从特征选择的结果中自适应地学习数据局部结构。通过局部结构学习和特征选择这两个基本任务的相互作用, MFAGFS可以精确捕获数据的结构信息以及选择出具有判别性的特征。然后,详细阐述了算法优化求解方法, 并证明了算法的收敛性。最后,在6个公开数据集上进行试验对比分析, 参数敏感性分析, 验证了所提模型的有效性。实验结果表明, 所提的方法与其他方法相比, 性能均有不同程度的提高。  相似文献   

18.
与特征选取和离散化集成的决策规则挖掘方法   总被引:1,自引:1,他引:0  
利用粗糙集理论可以从已知数据中挖掘决策规则 .对于连续取值的特征属性必须先对其离散化 .从给定的特征属性集合中去除冗余的特征属性 ,选取有用的属性子集有助于简化决策规则 .我们利用基于信息熵的规则不确定性量度函数构造了一个决策规则挖掘的遗传算法 ,将规则挖掘与特征选取和连续属性的离散化集成在一起 .实验结果说明了这种方法的有效性.  相似文献   

19.
To avoid the curse of dimensionality, text categorization (TC) algorithms based on machine learning (ML) have to use an feature selection (FS) method to reduce the dimensionality of feature space. Although having been widely used, FS process will generally cause information losing and then have much side-effect on the whole performance of TC algorithms. On the basis of the sparsity characteristic of text vectors, a new TC algorithm based on lazy feature selection (LFS) is presented. As a new type of embedded feature selection approach, the LFS method can greatly reduce the dimension of features without any information losing, which can improve both efficiency and performance of algorithms greatly. The experiments show the new algorithm can simultaneously achieve much higher both performance and efficiency than some of other classical TC algorithms.  相似文献   

20.
将高维特征用于跳频电台细微特征个体识别具有很大优势,为了增强对跳频电台的分类识别能力,需要增加特征类型和维数,提高特征集的表征能力,但同时会引入大量冗余特征,导致分类器计算时间过长,分类正确率降低。为了降低高维特征集维数,首先采用相关性快速过滤特征选择算法,删除高维特征集中的不相关冗余特征,得到最优特征集。然后利用经过参数优化的支持向量机(support vector machine, SVM)分类器进行训练分类。实验表明,所提算法能够对高维特征集进行合理的降维,提高了SVM的分类器的分类性能,在保证分类正确率的基础上,降低了运算量,提高了跳频电台细微特征识别的时效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号