首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 312 毫秒
1.
 针对基因表达数据中的高维小样本问题,提出了一种两阶段的识别框架:“偏最小二乘法(PLS)+极大间距准则(MMC)”。该方法首先使用PLS算法提取出带有分类信息的特征,然后使用MMC准则对样本进行分类。在六个公共的基因数据库上与一些常见的基因分类方法相比较,结果显示了该方法对基于基因表达数据的肿瘤分类有效且稳定。  相似文献   

2.
结合模糊C均值算法(FCM)与模糊最小-最大神经网络算法,提出一种基于超长方体集的模糊模式识别算法.首先采用基于特征加权的FCM算法进行粗划分,得到c个平行于特征轴的超椭圆球类;再根据已知的样本的类别标记进行进一步划分;以改进的最小-最大模型建立超长方体阵,使每个超长方体只能容纳一种类别的样本点,并且分属不同类别的超长方体无重叠.使用这种方法构建超长方体集更快速、更简单,但对训练样本的要求较高,应选择能够充分体现数据分布情况的数据点作为训练样本.  相似文献   

3.
结合模糊C均值算法(FCM)与模糊最小一最大神经网络算法。提出一种基于超长方体集的模糊模式识别算法.首先采用基于特征加权的FCM算法进行粗划分。得到c个平行于特征轴的超椭圆球类;再根据已知的样本的类别标记进行进一步划分;以改进的最小一最大模型建立超长方体阵,使每个超长方体只能容纳一种类别的样本点。并且分属不同类别的超长方体无重叠.使用这种方法构建超长方体集更快速、更简单,但对训练样本的要求较高,应选择能够充分体现数据分布情况的数据点作为训练样本.  相似文献   

4.
为快速对数据进行特征选择以实现精确分类,采用M-distance算法思想进行数据集簇聚类,对样本数据进行预处理;设计加权K近邻算法缩减样本间距并构建样本分类模型;采用模拟简谐振动的方法遍历样本数据,求解最优加权特征向量,实现样本分类.实验结果表明:设计的算法是正确的,分类模型是合理的.在样本数据特征中,分离出的消费者最为关心的前10个样本特征符合消费者的行为选择,说明算法设计有一定实用性.  相似文献   

5.
一种基于特征加权的K Nearest Neighbor算法   总被引:1,自引:0,他引:1  
传统的KNN算法一般采用欧式距离公式度量两样本间的距离.由于在实际样本数据集合中每一个属性对样本的贡献作用是不尽相同的,通常采用加权欧式距离公式.笔者提出一种计算权重的方法,即基于特征加权KNN算法.经实验证明,该算法与经典的赋权算法相比具有较好的分类效果.  相似文献   

6.
针对不平衡分类问题中各类别规模差异较大导致的较小类别分类精度不高的情况,提出基于先验概率的加权神经网络模型.为了提高较小类别在迭代神经网络中的重要性,以每一类样本的先验概率的倒数作为该类数据的权重,将该权重加人神经网络的目标损失函数中,并基于新构造的目标函数进行网络迭代,加强对少数类别的代价敏感学习,从而提高对小类别样本的识别率.最后利用真实分类数据进行实证分析,与经典神经网络对比,证明模型的有效性与实用性.  相似文献   

7.
在脑机接口的研究中,针对运动想象脑电信号的特征识别,提出了一种基于概率协作表示的分类方法(probabilistic collaborative representation based classification, ProCRC),通过比较测试样本在每个类别中的最大可能性,从而确定其所属的类别。采用BCI竞赛数据库Ⅲ中的数据集Ⅰ,利用S变换进行特征提取,然后对不同的分类器进行比较,以分类准确率作为评价标准验证了该算法的有效性。该算法的分类准确率能够达到90%,为脑机接口系统分类算法的研究提供了新思路。  相似文献   

8.
基于加权超球支持向量机算法的超文本分类研究   总被引:3,自引:0,他引:3  
为提高超文本分类算法的性能,降低算法的复杂度,提出一种适用于超文本分类的加权超球支持向量机算法.该算法综合文档内容信息和超链接信息作为文档特征向量,针对传统超球支持向量机算法在不同类别样本数目不均衡时训练分类错误倾向于样本数目小的类别的问题,利用加权因子补偿了类别差异对算法推广性能造成的不利影响.在基准数据集上的测试结果表明,该算法降低了二次规划的复杂度,提高了分类器的分类性能.  相似文献   

9.
在聚类算法和特征向量维数确定的模式样本集中,各样本的每一维表示一个对应特征;鉴于此在基于层次算法的基础上,提出了一种基于概率的快速聚类算法;该算法先对各个特征进行分类,然后按照概率准则,每个向量先自成一类,将其对应概率最大的特征向量合并,减少类别数,直至达到要求为止;用UCI中的Iris和Wine数据集对该算法进行仿真实验,实验数据表明:用该算法进行聚类,能获得较好的聚类结果,说明算法具有一定的有效性.  相似文献   

10.
程国 《科学技术与工程》2012,12(15):3640-3644
为了提高最大间距准则法表征人脸特征空间的能力,提出了一种融合最大间距准则和二进制粒子群优化算法的人脸识别方法。利用离散二进制粒子群算法对最大间距准则变换后的特征向量进行选择优化,获得有利于分类的最优特征子空间。在ORL和Yale标准人脸库上的实验结果表明,该方法不但降低了特征空间的维数,而且更好的发挥了最大间距准则算法的优点,提高了人脸识别的速度和精度。  相似文献   

11.
针对不同故障特征属性交互重叠导致的故障类别辨识困难问题,提出一种基于Manhattan距离作为特征之间相似度信息测度的权值判别拉普拉斯分值特征选择方法.该方法采用Manhattan距离衡量高维特征矢量之间的相似度,并将数据样本标记信息融入权值计算中以增强权值的判别性,提升了LS算法的敏感特征筛选性能.将M-WDLS和主成分分析相结合,提出基于M-WDLS和PCA的转子故障诊断方法.首先提取原始振动信号的时域、频域、时频域特征构造混合域特征集;然后利用M-WDLS选择敏感特征组成敏感特征矩阵;最后对敏感特征矩阵进行PCA降维处理,并将结果输入到K-近邻分类器中进行模式识别.对比实验的结果表明,该方法能有效提取转子系统振动信号的状态特征,有助于提高故障辨识的准确率.  相似文献   

12.
将子空间分类法拓展到特征空间后,与核主成分分析结合提出了一种边缘检测的方法及其训练样本选择策略。是基于特征空间中的核方法,对图像特征表达建立了统一的模型,可处理非高斯分布的数据。可与经典的边缘检测算子或其他方法相结合,增强边缘检测的效果和稳定性。只需训练一次,便可将边缘特征从一幅与训练图完全不同的测试图中提取出来。实验结果表明,对噪声有很好的鲁棒性,能很好地适应小样本训练,其边缘检测的效果明显比经典算子,主成分分析,非线性主成分分析的效果好。  相似文献   

13.
针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率.  相似文献   

14.
以湖北洪湖湿地自然保护区为研究区,采用随机森林算法对研究区内湿地信息提取.以Sentinel-2A遥感影像为数据源提取光谱特征、植被指数、水体指数、红边指数、纹理特征等特征变量,在随机森林算法框架下,对不同特征变量进行特征重要性评估,比较分类后精度并对特征组合进行优选.将基于随机森林算法的分类精度与传统的基于像元的支持向量机分类方法和最大似然分类方法的分类精度相比较,并通过双比例Z检验比较各算法中正确分类像元的比例统计各分类算法之间的分布差异.结果表明: 1) 特征个数为13时,分类精度达到最大,随着特征个数的增多,分类精度呈现波动减小的趋势; 2) 特征变量中蓝光波段重要性得分最高,达到2.85,可见光(B2、B3)与红边指数(IRECI、MCARI)重要性排名靠前,对于提取湖泊湿地信息具有重要意义; 3) 基于特征优选的随机森林方法分类精度优于支持向量机和最大似然法分类后的精度,其总体精度分别高出6.02%和7.57%;经检验, χ2分别达到25.891和38.895,具有显著差异,表明基于特征优选的随机森林算法分类对湿地信息提取发挥重要作用。  相似文献   

15.
一种基于特征选择的面向对象遥感影像分类方法   总被引:2,自引:1,他引:1  
针对GF—1多空间分辨率遥感数据空间信息丰富,传统影像分类方法无法满足实际应用需要的问题,提出了一种基于特征选择的面向对象遥感影像分类方法——object-RJMC算法,即在影像分割及特征提取的基础上,运用Relief F算法和J-M(Jeffries-Matusita)距离算法去除无关及冗余特征,筛选出适于各类别分类的特征,然后利用CART算法建立分类规则,完成分类过程。以GF-1号2 m、8 m和16 m空间分辨率的三组影像进行算法验证,并与object-CART和pixel-CART影像分类方法进行对比分析。实验结果显示object-RJMC算法的分类精度均高于object-CART和pixel-CART算法的分类精度;且对高空间分辨率的影像分类效果要优于对中低空间分辨率影像的分类效果。该算法减少了特征选择及规则建立的人工干预,克服了以像素为单位的分类算法中由于缺少空间邻域信息而产生孤立、离散、不连通分类结果的问题,可有效地提高GF-1遥感影像分类精度。  相似文献   

16.
为消除人体穴位的阻抗信号特征集中存在的冗余和不相关分量的问题,提出了一种基于遗传算法的人体穴位阻抗特征子集选择与优化算法.通过分析穴位阻抗信号的自回归(AR)模型谱图建立了穴位原始特征样本集,利用类内-类间距离判据构造遗传算法的适应度函数并改进遗传算法的特征优化算子.经人体穴位的电阻抗特征选择与优化实例分析表明:该方法具有较好的寻优性能和适应度稳定,在不增加原始信息的情况下,能够有效地减少分类识别的特征数和提高信号识别的准确率,且将穴位阻抗特征的平均状态辨识率提高9%左右.  相似文献   

17.
针对实际模式识别系统中样本特征常具有的连续值属性、高维性、强相关性和冗余性等影响分类效果的问题,在广义邻域粗集模型下提出一种集成特征选择及其选择性集成算法.该算法先提取样本特征并利用所提出的马氏距离分布熵评估其重要度,再基于特征重要度构建广义邻域粗集模型,并在此模型上以特征重要度为启发式信息设计基于蚁群算法的属性约简算法,然后通过改变广义邻域粗集模型参数的方式获得更多具有更大差异性的基分类器,最后利用主成分分析法对产生的基分类器进行选择性集成.模拟电路故障诊断结果表明,该算法比AdaBoost等算法取得的分类精度至少提高了2.6%.  相似文献   

18.
互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method, FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号