首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 905 毫秒
1.
基于基因表达谱的特征基因提取方法已经成为当今研究肿瘤分子诊断的热点,该文中提出了一种基于邻域不定性信息与记分准则相结合的肿瘤特征基因提取方法,该方法首先通过邻域不定性信息确定每个样本的邻域信息量,然后使用记分准则提取特征基因,最后利用KNN对样本进行分类.通过对白血病和弥漫性大B细胞淋巴瘤基因表达谱数据的特征选择,验证了该文方法的有效性和可靠性.  相似文献   

2.
文中提出了一种结合非负矩阵分解和Normal_Matrix谱分解技术的肿瘤基因分类方法.其分类过程首先是利用fdr_test记分准则粗略除去噪声基因以实现基因表达谱数据的初步降维,进而运用非负矩阵分解萃取基因间的综合属性,通过综合属性构造样本间的Normal_Matrix并对其进行奇异值分解获取表征样本类别属性的谱分量实现肿瘤类型的分类识别.采用三组具有代表性的肿瘤基因表达谱数据进行实验,通过与其他方法的对比,其结果证明了文中方法的可行性和有效性.  相似文献   

3.
特征选择是模式识别经典而重要的课题.由于不同类别样本之间存在边缘样本点,其分布区域互相交叉重叠,经典的MMC(Maximize Marginal Criterion)方法简单地采用最大化类中心距离,不利于样本分类.针对此问题,给出了一种基于加权最大边缘间距准则(加权MMC)并改进了的特征选择算法,该方法考虑了不同类别数据边缘样本点在模式分类中的作用,建立了基于最大边缘间距的新型特征评分准则,提高了边缘样本点在衡量特征判别能力时的作用.在公开数据集PIE和MIT-CBCL3000标准人脸图像库上进行了实验,结果表明,该算法与经典的MMC特征选择算法相比较具有明显的优势.  相似文献   

4.
DNA 微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于粗糙集的支持向量机基因表达数据分类方法,该方法采用粗糙集进行基因特征约简,运用支持向量机进行数据分类,实验表明其分类效果良好.  相似文献   

5.
提出基于稀疏表示和最小二乘回归的分类方法:用训练样本重构测试样本,先利用稀疏表示剔除噪声样本,接着用最小二乘回归和最近邻子空间准则对样本分类,可以克服传统分类方法存在的过拟合问题.在6个基因表达数据上的实验结果表明,该方法可以提高分类准确率.  相似文献   

6.
基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特征表示引入到基因表达谱数据分类中,从而高维空间离散点分布问题便可以转化成为具有结构信息的图问题.文中对基因表达谱数据样本点构造高斯权邻接矩阵,SVD分解后,采用特征记分准则进行筛选,找出最大限度区分肿瘤样本与正常样本的主分量作为样本特征,输入KNN分类器进行分类,通过对白血病两个亚型(ALL与AML)与结肠癌表达谱数据进行实验,证明了文中方法的可行性与有效性.  相似文献   

7.
伴随着基因芯片的发展,通过研究海量的基因表达谱数据来识别肿瘤已成为生物信息学研究的热点.提出一种基于LoG(Laplace of Gaussian)矩阵分解的肿瘤基因特征提取方法,该方法首先将样本数据映射为高维空间中的点,然后构建点与点之间的LoG矩阵,在保留样本分类信息的情况下,使得无结构信息的基因表达谱数据变成具有结构信息的图,再对LoG权值矩阵进行非负矩阵分解得到能够表征样本特征的特征分量,最后用KNN对样本进行分类.通过对白血病和结肠癌基因表达谱数据的特征提取,验证该文方法的可行性和有效性.  相似文献   

8.
随着DNA微列阵技术的发展,利用基因表达谱数据进行生物信息的有效挖掘已经成为研究热点.因此,该文中提出将点的代数连通强度与非负矩阵分解相结合的方法对基因表达数据进行分类处理.首先利用点的代数连通强度剔除受外界因素影响过大的基因数据并用修正的特征计分准则进行计分排序,选取具有高计分的基因子集;接着利用近来流行的非负矩阵分解将该基因子集映射到极低维的特征空间;最后利用SVM分类器实现分类实验.通过几组公开的基因表达谱数据集的实验结果以及与其他方法的对比分析,验证了该方法是有效的、可行的.  相似文献   

9.
提出了一种结合最大间距准则(MMC)和差分向量的特征提取方法,将其应用在人脸识别中.首先对样本图像进行Gram-Schmidt正交变换得到每类样本的共同向量;然后将每幅原始图像与该类的共同向量之间的差作为差分向量,通过MMC方法得到差分向量的最优投影变换矩阵;最后将测试样本的差分向量和训练样本的差分向量投影到最优投影变换矩阵上获得特征向量,利用三阶近邻分类器进行分类识别.在ORL和Yale人脸数据库上的实验结果表明了该方法具有较好的识别性能.  相似文献   

10.
基于结肠癌基因表达谱数据集,提出了一种信息基因提取的新方法。该方法结合了支持向量机(SVM)、Bhattacharyya距离、递归特征消除(RFE)和快速基于相关性过滤器(FCBF)方法。首先,利用Bhattacharyya距离与SVM-RFE方法结合去除无关基因,然后运用FCBF方法得到信息基因,最后以支持向量机作为分类器对结肠癌样本进行分类识别。实验结果表明,同现有的方法相比,该方法在提取基因数量和准确率上都有明显的优势。  相似文献   

11.
基于偏最小二乘回归分析,提出了一种新的人脸表示与重构方法.与主成分分析相比,通过偏最小二乘所抽取的低维人脸表示特征具有更好的分类性能.在ORL人脸数据库上的实验结果表明,基于偏最小二乘方法对于测试图像进行重构优于主成分分析方法,并且分类结果也好于后者.  相似文献   

12.
癌症基因表达数据的熵度量分类方法   总被引:5,自引:4,他引:1  
基因芯片技术的出现和发展为生物医学领域带来了深远影响,运用分类方法研究其产生的海量数据对癌症的分类及治疗有重要意义.该文提出一种利用熵度量作为指标进行癌症基因表达数据特征提取的方法.首先对基因表达数据进行筛选并计算各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进行分类.对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有效性.  相似文献   

13.
一种新的手写体字符识别算法   总被引:2,自引:0,他引:2  
研究模式识别的核心问题——特征抽取.基于偏最小二乘(Partial Least Squares,简称PLS)回归和特征融合的思想,提出了一种组合特征抽取的新方法并将之用于手写体字符识别中.在PLS建模阶段,为了提高PLS成分(特征)的抽取速度,提出了一种非迭代PLS算法.在特征融合阶段,用所抽取的PLS成分特征组成模式的相关特征矩阵,并依此相关特征矩阵进行分类.在Concordia University CENPARMI手写体阿拉伯数字数据库上的试验结果证实了该方法的有效性和鲁棒性,其分类结果优于基于单一特征的FSLDA方法的分类结果.另外,与已有的迭代PLS算法相比,所提出的非迭代PLS算法的复杂度和特征抽取的速度均占有优势.  相似文献   

14.
针对基因表达谱微阵列的数据多分类问题,给出一种在多病类情况下的基于信噪比和相关性的特征基因选择方法.该方法一次性考虑基因区分所有病类的能力,尽量避免基因的冗余性;其次利用支持向量机,构建了基因表达谱微阵列数据的多分类器;最后通过实验表明了本方法的有效性.  相似文献   

15.
程国 《科学技术与工程》2012,12(15):3640-3644
为了提高最大间距准则法表征人脸特征空间的能力,提出了一种融合最大间距准则和二进制粒子群优化算法的人脸识别方法。利用离散二进制粒子群算法对最大间距准则变换后的特征向量进行选择优化,获得有利于分类的最优特征子空间。在ORL和Yale标准人脸库上的实验结果表明,该方法不但降低了特征空间的维数,而且更好的发挥了最大间距准则算法的优点,提高了人脸识别的速度和精度。  相似文献   

16.
运用小波的降噪性建立一种基于肿瘤基因表达谱的聚类分析模型,采用小波变换、信息抽取、双向聚类的方法对基因表达谱进行有效的分析.通过这种模型,可以降低基因表达谱的噪音以及样本错聚率.最后,将该方法应用于结肠癌基因表达谱的分析.  相似文献   

17.
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.  相似文献   

18.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号