首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集.这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题.为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighbor...  相似文献   

2.
假设对于两个流形上关联性较强的样本点,其邻域点之间也会具有较强的关联性.基于此假设,提出一种新的非监督流形对齐算法,通过学习局部邻域之间的关联性,挖掘不同流形样本点间的关联性;然后,将两个流形样本点投影到共同的低维空间,同时保持所挖掘的关联性.结果表明:与传统的非监督流形对齐算法比较,文中算法能更准确地找出不同流形数据在低维空间的匹配点.  相似文献   

3.
在介绍了基于信息熵的蚁群聚类算法以及流形学习的方法的基础上,将基于动态切空间排列的流形学习方法与该蚁群聚类算法相结合,给出了一种聚类算法的新思路,并在城市规划布局问题中做了仿真实验,提高了算法的收敛速度。  相似文献   

4.
针对基因表达数据集的基因选择问题,采用邻域熵度量与蚁群优化原理,提出一种基因选择方法.首先,引入邻域粗糙集模型对基因数据进行邻域粒化,定义邻域熵度量用于剔除冗余基因构成预选择基因子集;然后,采用邻域熵构造基因重要度作为启发式信息,发挥蚁群优化算法的分布式、正反馈及全局寻优的优势,运用蚁群优化算法从预选择基因子集中搜索出最小基因子集;最后,在选取的最小基因子集上进行分类测试.实验表明:建立在该最小基因子集上的分类器具有良好的分类性能.  相似文献   

5.
基于非线性流形学习的喘振监测技术研究   总被引:3,自引:0,他引:3  
为了提取压缩机喘振发作时表现出的非线性特性,引入了一种新的喘振特征提取方法.首先对原始信号进行多元统计分析,构造高维特征空间,然后利用局部切空间排列的流形学习方法提取出一维主流形,进而通过主流形几何结构的变化来反映系统的非线性变化.分析结果表明,与相关积分方法相比,该方法可以提前1 s识别出喘振特征,并且能够降低误报率,因此在喘振监测中具有良好的应用前景.  相似文献   

6.
针对目前基于粗糙集模型的特征选择算法无法直接应用于数值型数据、必须经过离散化过程而造成决策信息丢失的问题,提出了一种基于邻域决策分辨率的特征选择算法。该算法根据邻域信息粒中决策分布与其分类能力间的关系,提出了邻域决策确定性(Nc)来衡量单个信息粒的决策分辨能力;并根据特征向量空间上所有信息粒所具有的Nc累加值,定义了邻域决策分辨率作为特征子集上决策可分辨性的量度,从而将名义型和数值型数据统一在同一特征选择算法框架下。仿真实验和实际应用的结果表明,该算法性能优于目前主流基于邻域粗糙集的特征选择方法。  相似文献   

7.
针对故障特征集维数高以及冗余的问题,提出一种自适应邻域选择的改进局部切空间排列维数约简方法.通过考虑流形的采样密度、局部弯曲度和局部切空间近似偏离角度,自适应构建样本邻域,以保证局部线性度,能提高算法鲁棒性.为提高故障诊断准确率,提出改进Fisher准则的特征评价方法,首先对原始特征集进行特征选择,优选出能表征类间散度大、类内散度小和低冗余的故障特征,然后采用改进的局部切空间排列算法进行特征融合,得到低维的敏感特征子集,并输入到k最近邻分类器进行故障识别.用滚动轴承不同部位、不同故障程度的实验数据验证了该方法的有效性.  相似文献   

8.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

9.
针对基于流形正则化自表示(MRSR)的无监督特征选择算法直接从原始的样本空间构造相似矩阵可能会 导致重构空间中样本的相似性描述得不够准确的问题,提出了基于自适应流形正则化自表示的无监督特征选择 (AMRSR)算法。 基于自适应流形正则化自表示的无监督特征选择算法在 MRSR 算法的基础上通过对相似矩阵施 加概率最近邻约束将相似矩阵的学习嵌入到优化过程中,在重构空间中自适应地学习样本的相似性,使得在每一 次迭代中获取更加精确的样本局部几何流形结构,从而选择具有代表性且保持局部几何流形结构的特征。 最后, 在四个公开数据集上进行了大量的对比实验,通过将算法的特征选择结果用于 K-means 聚类并采取两种常见的聚 类评价指标:聚类精确度和归一化互信息评价聚类效果。 实验结果表明,AMRSR 算法与现有的一些算法相比有更 高的聚类精确度和归一化互信息,进一步表明该算法特征选择效果更好。  相似文献   

10.
针对动态自相关数据的特征提取和降维问题,提出了一种基于时序扩展的邻域保持嵌入(TNPE)的故障检测方法。针对邻域保持嵌入算法的不足,构建了新的优化目标,在构建局部空间结构特征的基础上,同时提取了数据随时间变化的动态特征。使得投影得到的低维空间不仅和原始变量空间具有相似的空间局部近邻结构,而且具有相似的时序动态结构,因而包含了更多的特征信息。在此基础上,利用TNPE算法将原始过程数据划分为特征空间和残差空间,并分别建立T2和SPE统计量实现工业过程监测。通过对Tennessee Eastman(TE)过程的仿真研究,验证了TNPE算法有效性可行性,并显示出了优越的故障检测能力。  相似文献   

11.
提出一种以相点距离矩阵和信噪比为测度的自适应选取邻域参数的局部投影降噪方法.首先将一维时间序列重构到高维相空间,然后计算相空间中各个相点间的距离以构成相点距离矩阵,并据此设定参考相点的初始邻域半径和动态搜索步长,自适应地选择邻域大小,再利用局部几何投影方法消除噪声,迭代此过程,历史输出信噪比达到最大时获得优化邻域.  相似文献   

12.
针对自组织映射(Self-Organizing Map,SOM)算法在进行流形学习时容易陷入局部极值和产生"拓扑缺陷"问题的原因,提出了一种新的基于SOM的流形学习算法:TO-SOM(Training Orderly-SOM).根据流形的局部欧氏性,TO-SOM算法从一个局部线性或近似线性的数据子集出发,按照数据的内在流形结构对其进行有序训练,可以避免局部极值、克服"拓扑缺陷".根据SOM算法的鲁棒性,TO-SOM算法在成功学习数据内在流形结构的同时,对邻域大小参数和噪声也不像ISOMAP和LLE等现有流形学习算法那样敏感,从而更容易得到实际应用.  相似文献   

13.
利用增量式非线性流形学习的状态监测方法   总被引:4,自引:0,他引:4  
针对传统流形学习方法难以处理大批量设备运行数据的特点,提出了一种采用增量式流形学习方法的机械设备状态监测方法.该方法首先利用局部切空间排列算法对训练样本集进行非线性维数约简,得到初始的低维流形结构,然后通过增量式学习机制对新增的时序样本点进行动态聚类.通过对压缩机喘振试验数据及滚动轴承故障数据的分析表明,该方法的计算复杂度低,可以有效地识别出隐藏在高维特征集中的非线性故障特征,因此具有良好的工程应用前景.  相似文献   

14.
为了快速寻找短波频段内的目标频点,结合宽带频谱感知技术,提出了基于变邻域粒子群搜索(V N S-PS O)的短波双向探测频率选择算法.现有的探测频率选择算法依据频点的平均信噪比进行评估选优,未考虑短波信道的小尺度随机衰落特性,难以满足实时选频的要求.文中VNS-PSO算法依据大尺度衰落的相关特性,采用最大分离法得到初始探测频点集,以此来划分相关邻域;针对邻域内频点质量选择性衰落特点,采用粒子群优化算法搜索邻域内频点,得到邻域内最优解;通过变换邻域,得到全局最优解.仿真实验表明:"最快速度"建链时,VNS-PSO算法较VNS-RS、AASS、RSS算法M TOBC分别降低17.1%、18%、85.5%,当CPOS=0.9,建链时间分别降低2.5%,42.6%,81.7%,缩短了建立可通链路的时间;"最优频点"建链时,VNS-PSO算法较VNS-RS、AASS、RSS算法M TOBC分别降低11%、12.5%、45%,当CPOS=0.9,建链时间分别降低22.2%、22.4%、44.4%,短时间可找到最优频点.  相似文献   

15.
一种基于微分流型的Web检索算法   总被引:1,自引:0,他引:1  
为进一步提高Web的检索性能,提出了一种基于微分流型的 Web检索算法.该算法的核心思想为:用微分流型描述Web空间,用流型的切平面模拟Web的切空间,将流型上2点之间的测地线距离转化为二维平面上点与点之间的欧氏距离,基于距离的匹配过程由原来的在整个文档集合中进行,转换为仅在查询的邻域内进行,以减少匹配过程的计算量.实验结果表明,该算法的查准率比 Google和 IIT分别提高 35 24%和40 93%,它更适合于大型异构Web文档集合的检索.  相似文献   

16.
流形学习算法是维度约简与数据可视化领域的重要工具,提高算法的效率与健壮性对其实际应用有积极意义.经典的流形学习算法普遍的对噪音点较为敏感,现有的改进算法尚存在不足.本文提出一种基于监督学习与核函数的健壮流形学习算法,把核方法与监督学习引入降维过程,利用已知标签数据信息与核函数特性,使得同类样本变得紧密,不同类样本变成分...  相似文献   

17.
作为一种有效的非线性降维方法,流形学习在众多领域吸引了广泛的关注并取得了长足的发展。但当样本点较为稀疏时,样本点的局部邻域很难满足流形学习局部同胚的前提条件,此时流形学习算法往往效果变差甚至失效。一种有效的解决方法是增加一些新的插值点。但已有的插值方法选取的插值点与原样本点均存在线性关系。从线性代数的理论来说,由插值点和原有邻域点张成的线性子空间与原有邻域点张成的子空间是一样的,因此,不会改善线性逼近的误差。而且,插值点没有反应出流形的本质结构和特征,从理论上背离了数据降维的目的。为此,提出了一种基于Biharmonic非线性插值技术的流形学习算法BbMLA。由于是从高维曲面逼近的角度非线性的选择插值点,插值出的样本点不会被原有邻域点线性表示,从而能更好的重构原样本点。将BbMLA应用到多个数据集后,图示说明了插值点能够有效的改善邻域内的样本点结构,同时插值后的流形学习算法具有较好的有效性和稳定性。  相似文献   

18.
【目的】提高现有的基于相干邻居亲近度(Coherence neighborhood propinquity)的标签传播算法(Label propagation algorithm,LPA)社区发现的准确性,并减少标签传播过程花费的时间。【方法】在CNP-LPA算法基础上,引入节点间依赖度,提出一种改进的CNP-LPA+算法,在预处理阶段结合相干邻居亲近度与节点间依赖度,将依赖度高的节点并入本区域内的核心节点,并在得到的核心CNP网络基础上传播标签,显著提高了社区发现的质量。选取CNP-LPA算法使用的6组社交网络数据集,采用模块度Q评估LPA、CNP-LPA、CNP-LPA+3种算法的划分结果。【结果】CNP-LPA+算法在所有数据集上均取得了最高的Q值,有效提高了算法的准确性,并减少了标签传播过程花费的时间。【结论】CNP-LPA+算法是有效的。  相似文献   

19.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号