首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为消除人体穴位的阻抗信号特征集中存在的冗余和不相关分量的问题,提出了一种基于遗传算法的人体穴位阻抗特征子集选择与优化算法.通过分析穴位阻抗信号的自回归(AR)模型谱图建立了穴位原始特征样本集,利用类内-类间距离判据构造遗传算法的适应度函数并改进遗传算法的特征优化算子.经人体穴位的电阻抗特征选择与优化实例分析表明:该方法具有较好的寻优性能和适应度稳定,在不增加原始信息的情况下,能够有效地减少分类识别的特征数和提高信号识别的准确率,且将穴位阻抗特征的平均状态辨识率提高9%左右.  相似文献   

2.
针对故障特征集维数高以及冗余的问题,提出一种自适应邻域选择的改进局部切空间排列维数约简方法.通过考虑流形的采样密度、局部弯曲度和局部切空间近似偏离角度,自适应构建样本邻域,以保证局部线性度,能提高算法鲁棒性.为提高故障诊断准确率,提出改进Fisher准则的特征评价方法,首先对原始特征集进行特征选择,优选出能表征类间散度大、类内散度小和低冗余的故障特征,然后采用改进的局部切空间排列算法进行特征融合,得到低维的敏感特征子集,并输入到k最近邻分类器进行故障识别.用滚动轴承不同部位、不同故障程度的实验数据验证了该方法的有效性.  相似文献   

3.
电力负荷具有时空多变的特性,受众多因素的影响,在短期负荷预测中较多的输入特征会造成维度灾难,导致模型预测性能不佳,因此选择合理的输入特征集至关重要。文章提出一种新的短期负荷预测特征选择方法——mRMR-IPSO双阶段法。利用最大相关最小冗余(max-relevance and min-redundancy,mRMR)判据对原始特征进行排序,考虑输入特征与输出特征之间相关性和输入特征间冗余性,筛选掉一些排序靠后的特征,初选出对预测效果影响显著的特征子集;采用基于改进的粒子群优化算法(improved particle swarm optimization,IPSO)的搜索策略,以LightGBM模型的预测精度为适应度函数,对初选特征子集进行精选,得到最优特征子集。算例结果表明,所提方法能在对原始特征集大幅降维的情况下提升预测精度。  相似文献   

4.
针对滚动轴承早期微弱故障识别率偏低的问题,提出一种基于EEMD、邻域粗糙集和模糊C均值聚类(FCM)算法相结合的滚动轴承特征提取方法.该方法将滚动轴承的原始信号进行EEMD分解得到若干个IMF分量,通过均方差和欧氏距离两个评价指标选取出敏感特征分量,构造原始特征数据集,对处理后的原始特征集属性进行NRS约简,剔除冗余属信息,最后将剩余属性的特征数据集作为模糊C均值聚类的输入,实现滚动轴承故障识别.为了对比本文方法对于滚动轴承的故障识别效果,分别添加了FCM、NRS-FCM和EEMD-FCM三种方法进行故障辨识,利用划分系数(PC)和划分熵(CE)对聚类结果进行评价与对比.通过实验表明:邻域粗糙集对于改进滚动轴承的故障识别效果十分明显,具有良好的应用前景.  相似文献   

5.
近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度.  相似文献   

6.
针对传统降维方法难以保持数据集的局部与全局几何结构特征问题,选择测地距离作为度量指标,提出改进t-SNE的故障数据集降维方法D-t-SNE.首先提取消噪振动信号的多域高维故障数据集,在对其进行归一化处理之后,利用GD指标改进后的D-t-SNE算法对高维故障数据集进行降维运算,去除冗余信息,然后通过不同的分类器对低维特征子集进行故障模式辨识.以UCI数据集和双跨转子实验台的模拟故障数据集为实验对象对D-t-SNE算法进行验证,并与SNE和t-SNE算法的各项实现结果进行对比.结果表明,D-t-SNE算法具有通过降低高维故障数据集的维数从而达到降低故障分类难度、提高故障辨识准确率的性能,可为降低旋转机械原始故障特征数据集的规模、降低故障分类的难度与提高故障辨识结果的可视化效果提供理论参考依据.  相似文献   

7.
高维聚类中的一种特征筛选方法   总被引:3,自引:0,他引:3       下载免费PDF全文
聚类分析是数据挖掘领域中一个基础而活跃的研究课题。由于大多数的聚类方法在处理高维数据时会出现高维失效问题,维简约成为高维聚类中一个非常重要的处理步骤。通过分析对象间相似性度量与原始数据分布间的关系,提出一种基于熵的特征筛选方法。该方法通过构造一个基于对象间相似度的熵度量,对原始特征集中的每个特征进行重要性评估,从而获得重要特征子集。实验结果显示,该方法可以有效剔除高维数据集中的不重要或噪声特征,改善聚类算法的性能和聚类结果的可理解性。  相似文献   

8.
特征选择作为一种常见的降维方法,一直以来都是机器学习和数据挖掘领域的热点话题.针对传统特征选择算法没有充分考虑特征全局冗余性,导致选择的特征子集对分类识别精度不够高的问题,提出基于复杂网络节点重要度评估和遗传算法的特征选择算法,将每个特征视为网络节点,根据互信息建立边,将特征选择问题转化为节点重要度评估问题,利用遗传算法选择最优特征子集.实验结果表明此算法能够找到较为优秀的特征子集,有效降维并提高分类精度.  相似文献   

9.
基于PCA-KLFDA的小样本故障数据集降维方法   总被引:1,自引:0,他引:1  
针对小样本故障数据集降维问题,提出一种基于主元分析(PCA)和核局部费歇尔判别分析相结合的子空间降维方法.该方法首先应用PCA提取数据集中的关键信息并实施降维,然后将该子空间通过高斯核方法映射至高维线性空间,并在高维空间基于局部费歇尔判别分析训练出一个最有辨别力的低维分类特征集.用双跨转子实验台的一组故障特征数据集进行验证,结果表明:该方法能有效应对小样本的降维问题,达到增大不同故障样本集合间距离、使同类故障样本间的类内距离减小的效果,为基于数据驱动途径实现智能故障辨识技术中涉及的小样本故障数据集类别划分问题提供了一种新方法.  相似文献   

10.
文本自动分类的一项关键技术是特征选择。本文针对信息过滤的特点,对特征选择方法进行了改进,提出了一种基于语义神经网络的文本特征选择方法。首先对原始特征集进行初始筛选,去除冗余特征及噪声后,对得到的特征子集采用语义神经网络进行智能的特征选择,其核心是关联度及激活变量的计算。从而得出代表问题空间的最优特征子集,实现降维并提高分类精度。实验证明,该方法可以极大地降低文本的维数,提高文本过滤的质量。  相似文献   

11.
借鉴基于正则回归的无监督并行正交基聚类特征选择法和最大互信息系数,提出正交基低冗余无监督特征选择法.该方法在正交基下选择具有判别能力的特征,可用最大互信息系数矩阵选择低冗余性的特征子集. 4个图像数据集上的实验结果表明:该方法选择的特征子集可以提高聚类准确率.  相似文献   

12.
针对高维数据集中冗余特征或无关特征降低机器学习模型分类准确率的问题,提出了一种基于近似马尔科夫毯的特征选择(nmRMR)算法。该算法首先利用最大相关最小冗余的准则进行特征相关性排序;采用近似马尔科夫毯算法对冗余特征或者无关特征进行删除,并最大程度地提高特征之间的相关性从而获得最优特征子集。在UCI的8个公开数据集上对比的实验结果表明:与mRMR算法相比,本文算法所选择出的特征子集数平均减少了6.875个,平均分类准确率提高了0.78%;与FullSet算法相比,本文算法所选择出的特征子集数平均减少了20.56个,平均分类准确率提高了1.88%;与FCBF算法相比,本文算法所选择出的特征子集数平均减少了3.187 5个,平均分类准确率提高了0.825%;本文算法总体优于其他算法。  相似文献   

13.
在肿瘤特征基因选择过程中,传统分类方法会选出大量冗余基因,而大量冗余基因会造成分类精度低和时间复杂度较高等问题,为了解决上述问题,提出一种结合信噪比过滤法与随机森林算法的肿瘤特征基因选择方法.该方法包含两个过程:首先使用信噪比过滤法剔除原始特征空间中的无关和冗余基因,从而获得与分类属性相关性较高的基因,选择出分类能力较强的预选特征子集;其次使用随机森林算法对特征基因子集进行分类,最终获得分类结果.实验结果显示,该算法可以快速有效地选择出肿瘤特征基因,并具有较高的分类精度.  相似文献   

14.
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy, mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性.  相似文献   

15.
针对高维数据中不相关特征、冗余特征等导致的分类任务计算量大、分类正确率低等问题,提出了一种基于归一化互信息的相关性快速过滤特征选择(FCBF-NMI)算法.该算法采用归一化互信息代替对称不确定性作为FCBF算法的相关性评价标准,进行特征与类别、特征与特征的相关性分析,删除不相关特征及冗余特征以获得最优特征子集.实验结果表明:FCBF-NMI算法得到的最优特征子集更合理,平均分类正确率为89.68%,所用时间平均低至2.64s.  相似文献   

16.
针对现有城市排水管道堵塞程度难以辨识的问题,提出一种基于多特征融合与随机森林的排水管道堵塞程度辨识方法.首先对排水管道中采集到的声响应信号进行分帧处理建立信号帧集合.其次,提取各个信号帧的A计权总声压级、能量熵、分形盒维数指标构建特征向量集合;引入距离可分性判据,以达到对特征向量集合去冗余并提高特征区分度的目的;并利用类内类间散布矩阵的迹作为权重实现特征的加权融合.最后,对加权融合的特征向量集合使用随机森林进行故障辨识.实验结果表明,基于距离可分性判据的多特征融合特征向量集合可取得更高的管道堵塞故障识别率;同时,随机森林的堵塞辨识模型与SVM辨识模型比较,随机森林辨识模型有较高的准确率和较快的辨识速度.经验证,本方法不仅能有效地识别不同程度的管道堵塞故障和重复堵塞情况,而且能够排除管道配件比如三通件对故障识别的影响.  相似文献   

17.
针对高维数据包含的不相关和冗余特征影响检测方法性能的问题,提出了集成filter和wrapper方法的混合特征选择新方法.采用基于信息增益的filter方法,删除不相关特征;采用基于改进的自适应遗传算法和评价函数的wrapper方法,获取最优特征子集.在入侵检测中的应用表明,该方法能降低特征选择的时间,检测率和虚警率均优于其它方法.  相似文献   

18.
针对ARCO(AUC and rank correlation coefficient optimization)算法在进行两类问题特征选择时,采用斯皮尔曼等级相关系数度量已选特征子集冗余性带来信息损失和特征相关性与冗余性度量取值范围不一致的缺陷,提出改进的Pearson相关系数度量特征冗余性,并归一化特征相关性和冗余性度量范围,得到APCO(AUC and improved Pearson correlation coefficient optimization)算法以克服ARCO算法的不足。同时,针对实现多类特征选择的MAUCD(using MAUC as the relevance metric to rank features directly)和MDFS(MAUC decomposition based feature selection method)算法没有考虑特征冗余,且MDFS易选择到局部最优特征子集的问题,提出适于多类问题的改进Pearson相关系数度量特征冗余性,得到基于mRMR(maximal relevance-minimal redundancy)框架的MAUCP和MDFSP算法,克服MAUCD和MDFS算法的缺陷。以SVM、NB和KNN为分类工具,构造基于所选特征子集的相应分类器,以其AUC(MAUC)值度量相应特征子集的性能。7个二类和3个多类不平衡基因数据集的实验结果表明:提出的APCO、MAUCP和MDFSP算法分别优于ARCO、MAUCD和MDFS算法,也优于其他经典基因选择算法。  相似文献   

19.
由于在评价冗余特征时只考虑对称不确定性或最大信息系数等某一种度量标准,使得现有的一些特征子集选择算法存在性能不理想的问题.针对该问题,提出了一种基于对称不确定性和三路交互信息的特征子集选择算法.首先,计算特征与类标签的对称不确定性,按照其值大小对特征作降序排序处理,并消除不相关特征;然后,计算特征间的对称不确定性以及特...  相似文献   

20.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号