首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
文中提出了一种结合非负矩阵分解和Normal_Matrix谱分解技术的肿瘤基因分类方法.其分类过程首先是利用fdr_test记分准则粗略除去噪声基因以实现基因表达谱数据的初步降维,进而运用非负矩阵分解萃取基因间的综合属性,通过综合属性构造样本间的Normal_Matrix并对其进行奇异值分解获取表征样本类别属性的谱分量实现肿瘤类型的分类识别.采用三组具有代表性的肿瘤基因表达谱数据进行实验,通过与其他方法的对比,其结果证明了文中方法的可行性和有效性.  相似文献   

2.
基于基因表达谱的肿瘤诊断方法有望成为临床医学上一种快速而有效的诊断方法,但由于基因表达谱数据存在高维数、小样本以及噪音大等特点,使得对其分类存在很大困难,所以很有必要寻找更为可行有效的分类方法.用贝叶斯分类器建立预测分类模型作为基因表达谱数据分类的一种新思路,以结肠癌的基因表达谱作为实验数据,利用MATLAB的贝叶斯网...  相似文献   

3.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

4.
以肿瘤基因表达谱指导肿瘤的分类是目前机器学习领域的一个研究热点.对多类别肿瘤分类中的关键问题——特征基因选择方法进行了研究,提出了混合式特征基因选择策略.该策略首先利用7种特征选择算法提取与分类高度相关的基因,随后采用SSiCP算法消除冗余基因.实验是在肺癌的多类别基因表达谱数据集上完成的.实验比较了7种特征选择算法的性能,发现CFS算法加SSiCP算法的混合式基因选择策略可以获得数量较少的特征基因集,在训练集和独立测试集均有较高的准确度.所获得的最精简基因集中的部分基因据文献报道与肺癌的发生发展密切相关.实验结果证实了混合式特征基因选择策略的有效性.  相似文献   

5.
基因表达谱数据分析已经逐渐成为疾病诊断和分类的常规步骤.目前人们对NMF(nonnegative matrix factorization)的大多数研究都专注于二因式分解.论文另辟蹊径,对BONMTF(bi-orthogonal nonnegative matrix tri-factorization)算法进行了系统化的分析,利用此算法得到表征样本属性的矩阵,并将其应用于基因表达谱数据分析,提高了样本识别率.实验采用4组具有代表性的肿瘤基因表达谱数据,其结果证明了论文方法针对不同数据集的识别率都比传统方法有所提高,具有一定的可行性及应用前景.  相似文献   

6.
基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特征表示引入到基因表达谱数据分类中,从而高维空间离散点分布问题便可以转化成为具有结构信息的图问题.文中对基因表达谱数据样本点构造高斯权邻接矩阵,SVD分解后,采用特征记分准则进行筛选,找出最大限度区分肿瘤样本与正常样本的主分量作为样本特征,输入KNN分类器进行分类,通过对白血病两个亚型(ALL与AML)与结肠癌表达谱数据进行实验,证明了文中方法的可行性与有效性.  相似文献   

7.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

8.
基因数据分类方法的研究是当前生物信息学的一个热点,利用基因微阵列技术所提供大量的基因数据为诊断不同种类的基因疾病提供了可能。依据基因表达谱建立有效的模型对肿瘤类型的识别、诊断和治疗具有重要应用价值。通过对肿瘤基因表达谱进行分析,提出一种新的去无关基因的分析方法。新方法首先通过引入参数数量与改进的信噪比结合,对已有的基因信噪比(REFSC)公式进行改进,然后用主成分分析法提取主要的分类信息,达到特征提取的目的。最后用支持向量机(SVM )对样本集进行分类测试,分类模型的核函数分别采用线性linear、多项式polymoid、径向基RBF核函数,对肿瘤样本集进行实验测试,实验表明了新方法是可行的和有效的。  相似文献   

9.
针对基因表达谱高维、小样本、高冗余和高噪声等特点,提出了一种特征基因混合选择方法.采用Relief F方法对原始基因进行排序,过滤无效基因,获得初选基因子集,给出了基于差分进化算法优化的核模糊粗糙集模型,进行了特征基因终选.仿真实验结果表明:所提算法比Relief F、Kruskal Wallis、Gini Index等算法在分类精度和基因数量等方面有明显优势.  相似文献   

10.
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号