首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
 针对基因表达数据中的高维小样本问题,提出了一种两阶段的识别框架:“偏最小二乘法(PLS)+极大间距准则(MMC)”。该方法首先使用PLS算法提取出带有分类信息的特征,然后使用MMC准则对样本进行分类。在六个公共的基因数据库上与一些常见的基因分类方法相比较,结果显示了该方法对基于基因表达数据的肿瘤分类有效且稳定。  相似文献   

2.
为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集。提出基于矩阵填充(matrix completion)与模糊C均值(fuzzy c-means algorithm,FCM)相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数据的冗余信息,通过模糊C均值聚类得到具有良好的低秩特性的基因语义片段,再利用矩阵填充方法分别对每个语义片段进行缺失点的重建。在不同数据集上进行实验,与传统缺失点估计算法比较。实验表明FCM_MC算法在缺失数据估计准确度和类结构保持度上效果得到有效提升,同时运行效率较高。  相似文献   

3.
Gene expression mieroarray data can be used to classify tumor types.We proposed a new procedure to classify human tumor samples based on mieroarray gene expressions by using a hybrid supervised learning method called MOEA WV(Multi-Objective Evolutionary Algorithm Weighted Voting).MOEA is used to search for a relatively few subsets of informative genes from the high-dimensional gene space,and WV is used as a classification tool.This new method has been applied to predicate the subtypes of lymphoma and outcomes of medulloblastoma.The results are relatively accurate and meaningful compared to those from other methods.  相似文献   

4.
基因表达数据聚类为肿瘤新类别的发现提供了重要手段。然而,直接对原始数据进行聚类会在一定程度上丢失数据本身隐含的流形结构信息,影响子空间分割方法的聚类效果。为解决这一问题,提出模式收缩最小二乘回归(pattern shrinking least square regression, PSLSR)子空间分割方法。该模型能够同时进行模式收缩和仿射矩阵的学习,并利用交替优化方法进行求解。在6个基因表达数据上的实验结果表明该方法优于现有子空间分割方法。  相似文献   

5.
癌症基因表达数据的熵度量分类方法   总被引:5,自引:4,他引:1  
基因芯片技术的出现和发展为生物医学领域带来了深远影响,运用分类方法研究其产生的海量数据对癌症的分类及治疗有重要意义.该文提出一种利用熵度量作为指标进行癌症基因表达数据特征提取的方法.首先对基因表达数据进行筛选并计算各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进行分类.对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有效性.  相似文献   

6.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

7.
Tumor diagnosis by analyzing gene expression profiles becomes an interesting topic in bioinformatics and the main problem is to identify the genes related to a tumor. This paper proposes a rank sum method to identify the related genes based on the rank sum test theory in statistics. The tumor diagnosis system is constructed by the support vector machine (SVM) trained on the set of the related gene expression profiles. The experiments demonstrate that the constructed tumor diagnosis system with the rank sum method and SVM can reach an accuracy level of 96.2% on the colon data and 100% on the leukemia data.  相似文献   

8.
In previous gene expression data analyses, supervised learning has mainly focused on the classification of attribute data, such as the different experimental conditions, different known classes of the same tumor and sex, However, supervised learning classification is not suitable for interval-scaled attributes such as age and survival outcome of cancer patients, For this problem, this paper proposed a new method by combining two well-known methods: principal component analysis (PCA) and Fisher analysis (FA). The method, PCA-FA, realizes supervised learning with two types of attributes (nominal attributes and intervalscaled attributes). The fuzzy FA was introduced to model the interval-scaled attributes. In this paper, an approximate linear relationship between gene expression data of lung adenocarcinoma patients and survival outcome is successfully revealed by PCA-TA.  相似文献   

9.
F-畸变数据的生成与修复   总被引:6,自引:0,他引:6  
P-集合是研究动态信息系统的一个新数学工具,应用P-集合的外P-集合与补充集合的关系,提出了F-畸变数据与-冗余数据的概念;给出F-畸变数据的生成定理和修复定理,包括F-畸变数据的辨识定理.最后给出F-畸变数据的修复准则与修复实例,其结果为研究动态信息系统的数据扩张提供了1种新方法.  相似文献   

10.
通过探讨间皮素(MSLN)与恶性胸膜间皮瘤临床病理之间的相关性及其预后意义.采用R 3.6.3对美国公共癌症基因数据库(TCGA)进行数据挖掘和分析,利用Oncomine数据库对非癌组织与癌组织中MSLN的表达量进行比较分析,采用基因表达谱动态分析(GEPIA)构建Kaplan-Meier生存模型探究MSLN表达量对恶...  相似文献   

11.
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.  相似文献   

12.
13.
基因芯片技术在肿瘤分型分类的研究中得到了广泛的应用.为了处理肿瘤基因表达谱数据,建立肿瘤分类预测模型,文中采用基因表达差异显著性分析方法,支持向量机,遗传算法相结合的多步骤降维分类方法.采用该方法处理大肠癌和白血病数据集,筛选到基因数量较少并且分类准确度较高的特征基因子集.实验结果表明,文中的方法可以快速有效地筛选肿瘤特征基因,获得更好的分类效果.  相似文献   

14.
文中提出了一种结合非负矩阵分解和Normal_Matrix谱分解技术的肿瘤基因分类方法.其分类过程首先是利用fdr_test记分准则粗略除去噪声基因以实现基因表达谱数据的初步降维,进而运用非负矩阵分解萃取基因间的综合属性,通过综合属性构造样本间的Normal_Matrix并对其进行奇异值分解获取表征样本类别属性的谱分量实现肿瘤类型的分类识别.采用三组具有代表性的肿瘤基因表达谱数据进行实验,通过与其他方法的对比,其结果证明了文中方法的可行性和有效性.  相似文献   

15.
MicroRNA特征与功能   总被引:3,自引:0,他引:3  
通过分析总结现代分子生物学国际前沿microRNA(miRNA)领域的研究文献,整理出miRNA研究的基本脉络和走向。miRNA是一类长度~22nt的非编码小分子RNA,在包括线虫、果绳、家鼠、人体以及拟南芥等生物中普遍存在;它在调节基因转录与表达,调控生物体正常发育等生理过程中扮演重要角色。从比较的角度出发,揭示了miRNA与小干扰RNA在其代谢与功能方面共用某些途径,相互交叉与替代,可能同属一个更广范围的小分子RNA介导的生理调控机制。miRNA的研究可能对新一代基因药物的开发具有深远意义。  相似文献   

16.
研究两个序列集合之间相似性度量,提出基于拉普拉斯矩阵特征值的分离度概念和公式表示.基于人工序列和真实DNA序列上的实验结果,证实了分离度能够度量序列间的相似程度.  相似文献   

17.
伴随着基因芯片的发展,通过研究海量的基因表达谱数据来识别肿瘤已成为生物信息学研究的热点.提出一种基于LoG(Laplace of Gaussian)矩阵分解的肿瘤基因特征提取方法,该方法首先将样本数据映射为高维空间中的点,然后构建点与点之间的LoG矩阵,在保留样本分类信息的情况下,使得无结构信息的基因表达谱数据变成具有结构信息的图,再对LoG权值矩阵进行非负矩阵分解得到能够表征样本特征的特征分量,最后用KNN对样本进行分类.通过对白血病和结肠癌基因表达谱数据的特征提取,验证该文方法的可行性和有效性.  相似文献   

18.
采用FCM方法对基因表达的微阵列数据进行聚类分析,应用核回归和PP回归相结合的方法设计预报器,利用决定系数遴选父代基因集合.将这种新的组合设计方法的分析结果与相关文献的结果进行对比分析,得出了较好的推断结果;可以将这种组合方法运用于致病基因簇的搜寻.  相似文献   

19.
采用生物信息学方法探讨GABRD基因在结肠癌样本中的表达及预后情况。通过UCSC XENA下载33种肿瘤类型和正常组织的RNA序列数据和相关临床数据,使用R软件分析GABRD基因在结肠癌样本中的表达,并筛选共表达基因,对其进行富集分析;分析GABRD基因对结肠癌患者生存及预后的影响,并建立预后列线图;构建GABRD基因的蛋白质-蛋白质相互作用(protein-proteininteraction, PPI)网络并筛选关键模块及枢纽基因,验证枢纽基因的生存及临床诊断价值。结果表明:GABRD基因在结肠癌样本中高表达并影响患者生存,筛选得到369个共表达基因,基因本体论(gene ontology, GO)功能富集发现其主要参与G蛋白偶联等生物学过程,京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)通路富集显示其主要参与AMPK等信号通路;构建出由51个节点和523个连接组成的PPI网络,筛选枢纽基因5个,其中2个显著影响生存,5个具有临床诊断价值。综上,GABRD基因在结肠癌样本中高表达,影响结肠癌患者生存及预后,可能...  相似文献   

20.
A series of retroviral vectors encoding human mdr1 gene alone as well as in combination with either human mgmt gene or human mutant Ser31-dhfr gene are engineered. The resultant retroviruses are used to transduce human umbilical cord blood CD34+ cells. It has been shown that expression of dual drug resistance genes in transduced cells confers a broad range of resistance to both kinds of corresponding drugs. These data suggest a rationale for the use of such double chemoresistance gene constructs in an in vivo model in which transduced hematopoietic cells will acquire multiple protection against the cytotoxic side effects of combination chemotherapy and may have future application in chemoprotection of normal tissues, thus killing tumor cells more effectively.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号