首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

2.
现有大多数多标记流特征选择算法在进行特征选择时,往往忽略标记间的相关性,易导致算法预测精度的下降。为解决这一问题,提出一种结合邻域信息和标记相关性的在线多标记流特征选择算法;定义自适应邻域关系解决邻域粗糙集的粒度选择问题,将其推广到多标记学习中;利用互信息计算标记间的相关性得到标记权重;通过邻域粗糙集和标记权重评估特征和标记间的相关性,并设计特征在线重要度分析、在线相关性分析和在线冗余度分析3种指标,以实现在线评价动态候选特征。在7组多标记数据集以及5个评价指标上的实验结果表明,所提算法综合性能较优。  相似文献   

3.
最大熵方法中特征选择算法的改进与纠错排歧   总被引:2,自引:0,他引:2  
对应用最大熵原理建立语言模型的特征选取方法作了改进.用特征模板从训练样本中获得候选特征集,应用频次与平均互信息相结合的方法从候选特征集中选取特征.在选择有效特征时,对候选特征集中出现频次大于某一限值的特征或平均互信息很大的特征直接加入有效特征集,且不是每选一个特征都调用参数的求解过程,从而加快了特征选择的速度.将改进的算法应用于文本纠错建议的排歧,实验证明,所改进的特征选择算法有效.  相似文献   

4.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

5.
数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高.  相似文献   

6.
作者讨论了人工神经网络矢量量化在多带激励语音压缩编码算法中的实际应用。采用Kohonen自组织特征映射神经网络技术对语音参数中的谱包络参数进行量化,利用Kohonen自组织特征映射神经网络具有的聚类特性,提出一种初始码本抽取和码本训练的实际算法,训练出具有明显拓扑结构和码本。利用语音的帧间相关性和训练网络的结构特性,提出一种称为“邻域搜索法”的快速码字搜索算法。实验表明,这种矢量量化算法使码卡搜索  相似文献   

7.
提出一种基于自适应邻域参数的拉普拉斯特征映射算法,该算法首先依据采样密度确定每个样本点的自适应邻域参数,然后根据流形弯曲度调整优化邻域参数.实验结果表明,改进后的算法能够取得比拉普拉斯特征映射算法更好的降维效果.  相似文献   

8.
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集。这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题。为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighborhood regularized self-representation, ANRSR)来选择具有代表性和判别性的特征子集。为了保留局部内在结构,该算法将基于自适应邻域的流形正则化运用到自表示模型中,并利用了一种迭代方法来解决此优化问题。最后,选取4种经典的无监督特征选择算法,在几个基准数据集上进行了对比实验,验证所提算法能够选出具有更高聚类精度和互信息的判别性特征子集。  相似文献   

9.
针对邻域粗糙集采用全局邻域求解近似,存在计算时间复杂度高且无法对基因表达谱精确描述的问题,构造了基于主成分分析(PCA)和改进邻域粗糙集(NRS)算法的PNRS模型.首先采用PCA算法获得低维的特征基因空间;然后利用改进的多邻域粗糙集算法进行特征基因选择,即采用欧氏距离计算每列属性邻域值,选取所有属性邻域集合计算邻域决策系统的近似;最后采用启发式搜索算法选择特征基因子集.实验结果表明,PNRS模型能够在选择出较小的基因子集的情况下获得较高的分类精度,从而验证了该方法的有效性.  相似文献   

10.
隐写检测特征维数的增加,不仅增加了分类器训练时间和预测时间,甚至还会造成"维数灾难".因此,为达到特征降维的目的,对空域隐写检测特征选择进行研究,提出了一种基于条件互信息的特征选择算法.该算法首先选取一个与类标签具有最大互信息的特征,接着选取与此特征和类标签具有最大条件互信息的一个特征;然后通过前向寻找方式,从未选择特征子集中循环选取与刚选取特征和类标签具有最大条件互信息的特征,一直到选出规定数目的特征后结束循环.实验结果表明,与其他算法相比,所提算法取得了较好的特征选择效果.  相似文献   

11.
针对基因表达数据集的基因选择问题,采用邻域熵度量与蚁群优化原理,提出一种基因选择方法.首先,引入邻域粗糙集模型对基因数据进行邻域粒化,定义邻域熵度量用于剔除冗余基因构成预选择基因子集;然后,采用邻域熵构造基因重要度作为启发式信息,发挥蚁群优化算法的分布式、正反馈及全局寻优的优势,运用蚁群优化算法从预选择基因子集中搜索出最小基因子集;最后,在选取的最小基因子集上进行分类测试.实验表明:建立在该最小基因子集上的分类器具有良好的分类性能.  相似文献   

12.
入侵检测系统是一种对网络进行安全保护的重要手段,提出了一种基于自组织映射网络的入侵检测算法,通过训练数据对自组织映射网络进行训练,得到一个用于进行入侵检测的网络安全检测算法.该网络安全检测算法通过建立3层自组织映射网络模型,设计了权值、邻域与学习率的更新方式,输出端的值则对应了网络输出各安全事件的发生概率.采用KDDCUP99进行仿真来对本算法进行验证,将具有最大概率的模型作为入侵检测结果.仿真实验表明,算法能有效实现网络入侵检测,具有较高的网络入侵检测率及较低的误检率和漏检率,同时与其他同类算法相比,对于各类网络攻击均具有更高的检测率.  相似文献   

13.
利用基于邻域的图像欧氏距离寻找最近邻,并用直接线性判别分析方法(Direct LDA)取代多维尺度分析法(MDS),提出一种改进的等距特征映射(ISOMAP)算法(KIMD-ISOMAP)进行降维.人脸图像分类试验表明:KIMD-ISOMAP提高了ISOMAP的分类能力,扩展了邻域半径的选取范围,在加高斯噪声和几何形变的情况下,该算法与其他方法相比,表现出较强的鲁棒性.  相似文献   

14.
针对自组织特征映射算法用于图像矢量量化存在的问题,为了提高矢量量化码书的性能,提出基于方差分类初始化码书的三维邻域SOM算法,通过对三维邻域SOM算法中的初始化码书算法进行改进,建立了基于方差分类的初始化码书算法.实验表明,用该算法设计图像矢量量化码书具有码矢利用率高、码书的性能好等优点.  相似文献   

15.
现有的多标记特征选择一般假设特征空间是固定已知的,然而实际应用中很多特征是需要在提取过程中实时地进行筛选.为此,提出基于邻域交互增益信息的多标记在线流特征选择算法.首先,基于多标记邻域互信息和邻域交互增益信息提出在线相关性分析与在线冗余性分析两种策略来评价特征;其次,基于邻域交互增益信息构建了在线流多标记特征选择的目标优化函数;最后,在六个多标记数据集和四个评价指标上,实验结果证明了该算法的有效性和稳定性.  相似文献   

16.
多标记学习广泛应用于图像分类、疾病诊断等领域,然而特征的高维性给多标记分类算法带来时间负担、过拟合和性能低等问题.基于多粒度邻域一致性设计相应的多标记特征选择算法:首先利用标记空间和特征空间邻域一致性来粒化所有样本,并基于多粒度邻域一致性观点定义新的多标记邻域信息熵和多标记邻域互信息;其次,基于邻域互信息构建一个评价候...  相似文献   

17.
在基于模拟退火算法的基础上提出了一种改进温度下降函数和自适应的生成邻域解的新型算法.该算法通过新提出的温度下降函数,使得在初始温度较高的时候下降较为平滑,同时在邻域解的生成过程中采用新的生成邻域解的方式,充分实现算法的全局性,克服传统模拟退火算法易陷入局部最优解的困境;同时在温度较低时候,平滑的温度下降方式也有利于进行充分的局部搜索,取得最优解.实验结果表明,与传统的模拟退火算法相比,提出的新型的模拟退火算法在三维片上网络的映射过程中,在功耗和收敛速度两个方面有显著的提升.  相似文献   

18.
针对复杂场景下的三维点云目标识别速度慢,准确率低的问题,提出了一种基于关键点的点对特征三维目标识别算法. 通过直接对关键点建立点对特征,避免了周围邻域局部曲面的特征计算,具有空间维度小和计算速度快的特点. 使用哈希表存储,加快了特征匹配的时间. 利用快速投票方案对模型点云和场景点云进行匹配识别,生成候选位姿,利用贪婪算法对候选位姿进行聚类与筛选,采用ICP算法对物体位姿进行优化,基于配准后的点云重叠情况完成目标识别. 对提出的算法在多个数据集以及真实场景下进行了实验,验证了所提出的识别方法具有可行性和有效性,且对噪声的鲁棒性较强,具有一定的实际工程应用价值.   相似文献   

19.
张毅斌  马盈仓 《河南科学》2019,37(4):521-527
多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊互信息的多标签特征选择算法.最后在同一准则下,将模糊互信息与原先的互信息特征选择算法及其他几种经典的特征选择算法进行比较.实验表明,此方法在一定程度上效果优于其他特征选择算法,是一种有效的多标签分类问题的特征选择方法.  相似文献   

20.
随着三维激光扫描仪的改进和普及,获取三维点云数据的方式越来越方便.法向量作为点云数据不可或缺的属性之一,在诸多算法中具有重要作用.由于受到噪声、离群点、非均匀采样等因素的影响,准确快速估计尖锐特征点的法向量仍然是具有挑战性的.提出基于邻域漂移的点云法向估计算法,实现准确快速地对尖锐特征点的法向进行估计.首先,对当前点的近邻点构造其邻域,所有近邻点所对应的邻域构成候选邻域集.利用协方差分析对候选邻域进行评价,并选取最优邻域用于最终的法向估计.实验结果表明本算法在法向估计的质量上与前沿算法持平,在运行速度上与传统PCA算法相近,可以最大程度兼顾法向质量与计算速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号