首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
癌症基因表达数据的熵度量分类方法   总被引:5,自引:4,他引:1  
基因芯片技术的出现和发展为生物医学领域带来了深远影响,运用分类方法研究其产生的海量数据对癌症的分类及治疗有重要意义.该文提出一种利用熵度量作为指标进行癌症基因表达数据特征提取的方法.首先对基因表达数据进行筛选并计算各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进行分类.对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有效性.  相似文献   

2.
基于互信息的差异共表达致病基因挖掘方法   总被引:1,自引:0,他引:1  
为了挖掘基因表达数据中的差异共表达致病基因模块,提出了基于互信息和最大团相结合的方法.互信息用于度量基因表达谱之间的相互关系,计算任意2条基因表达谱在2种不同样本中的互信息值,得到2个互信息矩阵M1和M2,选定2个阈值T1和T2(T1T2)将矩阵M1和M2二值化,并通过M1和M2中元素的逻辑"与"运算得到图的邻接矩阵,从邻接矩阵挖掘出的最大团则为差异共表达致病基因模块.将该方法应用于Colon数据,选定T1=2.2,T2=1.0,得到6个相互重叠的最大团,实验结果表明,该方法能有效挖掘出差异共表达致病基因模块.  相似文献   

3.
前列腺癌是男性癌症死亡的第二大原因,前列腺癌患者五年生存率仅为30%。m6A修饰和长链非编码RNA(Long non-coding RNA,lncRNA)在前列腺癌的预后中起着非常重要的作用。因此,研究m6A与lncRNA之间的关系对改善前列腺癌患者的预后生存将有所帮助。本文研究了与m6A相关的lncRNA和与免疫基因相关的lncRNA,通过LASSO分析构建了基于六个lncRNA基因的预后模型,将前列腺癌样本分为高、低风险组,KM生存分析显示高风险组患者预后较差。通过单因素和多因素分析发现该模型可能是预测前列腺癌患者的独立因素。通过突变数据分析发现肿瘤突变负荷与该模型存在密切联系;免疫浸润分析得出高、低风险组中免疫细胞浸润存在差异;GO和KEGG分析结果发现m6A修饰主要富集在肌肉收缩、离子通道活性上。这些研究结论有望提高前列腺癌患者的预后生存率。  相似文献   

4.
为构建基因调控网络,提出了一个基于时序互信息学习动态贝叶斯网络结构的学习算法.在计算基因间的时序互信息时,该算法考虑了时间序列微阵列数据的时间特性,并利用协方差矩阵计算互信息,没有将基因表达数据离散化,与基因表达数据的连续性相符合.在酵母菌周期细胞的实验数据上测试该算法,灵敏度为66.7%;该算法构建的基因调控网络与KEGG数据库中的网络相比较,发现了Cdc28与Cdc20、Chk1与Rad9的调控关系,这些调控关系在相应的生物学实验中得到验证.  相似文献   

5.
利用生物信息学筛选差异表达基因(Differentially Expressed Genes, DEGs),构建前列腺癌(Prostate Cancer, PCa)单细胞层面lncRNA-miRNA-mRNA调控网络,在分子水平上研究前列腺癌的发生发展过程及预后指标。首先从基因表达综合数据库(GEO)和癌症基因组图谱(TCGA)数据库分别下载单细胞RNA测序数据GSE157703和转录组测序数据TCGA-PRAD,通过R语言筛选差异表达信使RNA(DEmRNA)和差异表达长非编码RNA(DElncRNA),利用相关软件预测并构建lncRNA-miRNA-mRNA调控网络;然后使用R语言进行基因本体论(Gene Ontology, GO)和京都基因与基因百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析,运用STRING数据库、Cytoscape软件建立蛋白相互作用网络,同时对单细胞RNA测序数据进行质控、降维、聚类和分群,构建单细胞层面的lncRNA-miRNA-mRNA调控网络;最后进行生存分析,通过人类蛋白质图谱进行验证。结果...  相似文献   

6.
蛋白质-蛋白质相互作用(PPI)可通过基因表达量之间的相关系数来反映.研究癌细胞或组织中全局的PPI,有利于了解基因型和表型之间的关系,更好地发掘正常与异常细胞或组织之间的癌症发生发展机制.文中利用TCGA数据库中11种癌症5 726个样本的mRNA表达数据和临床信息,结合STRING和HPRD数据库中的PPI基因对,使用皮尔逊相关系数计算癌症组织特异PPI基因对在正常样本和癌症不同时期样本的相关系数,筛选得到癌症紊乱及癌症特异的PPI基因对.通过基因差异表达与生存分析,得到可能影响癌症发生发展的关键PPI基因对.结果表明:PPI基因对在癌症样本中的相关性要显著低于正常样本.癌症紊乱PPI基因对有2 812对,其中LRSAM1、ATXN1、SMARCC2与SMARCA2等基因出现在多个癌症中并通过相互作用聚类成网络模块,可能在癌症中发挥重要作用;癌症特异PPI基因对有31对,其中BMP1与COL1A1在癌症中的相互作用很可能促进癌细胞的迁移和浸润转移,对癌症产生、发展产生重要的影响.此外,在癌症紊乱及特异中筛选了113对具有差异表达的PPI基因对,其中有16对显著差异PPI基因对在7个癌症中具有生存显著差异.  相似文献   

7.
茎瘤芥是十字花科芸薹属植物的变种.本研究在前期的转录组测序和数字基因表达谱(DGE)测序的基础上进一步对榨菜的根组织进行了测序和分析.通过高通量RNA-Seq测序我们获得了高质量的数字基因表达谱数据超过一千万条,其中有约71%能比对到参考基因序列上.我们将根组织的数字基因表达谱数据与榨菜瘤茎膨大过程中的3个时期的数字基因表达谱数据进行了比较,获得了共有的(3组差异表达基因的交集)差异表达基因共3594个,对这些差异表达基因的表达趋势可以分为8个簇.同时对这些差异基因进行代谢途径的功能注释,发现这些差异表达基因除了在光合作用相关的途径外,主要分布在细胞壁的合成、降解以及二级代谢如类黄酮代谢等途径方面.通过对榨菜根组织的转录组测序,我们筛选得到了部分榨菜根与茎的差异表达基因,这些基因可能与榨菜的瘤茎膨大有关.  相似文献   

8.
利用基于局部感受野的超限学习机(ELM-LRF)算法从给定的基因表达数据中提取有效的特征来进行癌症检测与分类.首先使用主成分分析(PCA)方法对原数据进行适当预处理,减少数据中存在的冗余,然后构建特定的特征映射,将得到的数据映射到相应特征空间中去,最后对得到的数据特征进行训练学习,得到最终训练好的特征提取模型.实验表明,ELM-LRF的学习效率更高,取得的癌症检测效果比以往方法更好.  相似文献   

9.
癌症通常由基因发生突变引起,因此从大量基因中有效地识别出少量致癌基因具有重要意义.针对基因表达谱数据高维小样本的特点,将支持向量机递归特征消除(SVM-RFE)和特征聚类算法相结合,提出一种新的基因选择方法:K类别SVM-RFE(K-SVM-RFE).该算法通过特征排序算法去除大量无关基因,利用K均值聚类算法将相似基因聚为一类,并通过两次SVM-RFE算法精选致癌基因.随后将K-SVM-RFE算法应用于多个基因表达谱数据集,并对其中的关键参数设置进行了讨论.实验结果表明K-SVM-RFE算法所选基因较已有方法在分类准确率上有显著提高,特别是在选择少量致癌基因上效果提升更为明显.  相似文献   

10.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

11.
针对基因表达谱数据的高维度、低样本和连续型等特点,提出一种结合邻域互信息和自组织映射进行特征基因选取的方法.首先提出一种改进的Relief算法,对基因进行排序生成候选特征集合;然后提出基于邻域互信息的自组织映射算法对生成的候选特征基因进行聚类;最后利用提出的属性重要性系数从每一类簇中选择代表基因组成特征基因子集.实验结果表明,该方法可以快速有效地选取肿瘤特征基因,能获得较好的分类结果.  相似文献   

12.
数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高.  相似文献   

13.
为了重构基因调控网络,提出可以通过基因之间的布尔逻辑代数和逻辑电路网络得到基因调控的动态转换。进而找到整个基因网络的动态变化。利用熵互信息理论对基因表达进行处理,构建基因调控布尔网络。  相似文献   

14.
通过网络药理学的方法,研究三七-白及药对在疾病治疗过程中潜在的药理作用机制.采用TCMSP数据库筛选三七-白及药对的活性成分和作用靶点,并用Uniprot数据库校正靶点信息得到靶点基因,利用CTD数据库获得靶点基因相关的疾病类型,通过STRING数据库构建靶点蛋白相互作用网络,分析得到核心蛋白,运用DAVID数据库富集分析靶点基因参与的基因本体论(GO)生物学过程及京都基因与基因百科全书(KEGG)通路.共筛选得到17个活性成分,涉及193个作用靶点.结果表明:槲皮素、β-谷甾醇和豆甾醇的作用靶点数目最多;靶点基因与35类疾病相关,主要包括癌症、神经系统疾病、心血管疾病等;蛋白相互作用网络分析得到核心蛋白AKT1,MAPK1,c-Jun,P53,TNF等;靶点基因主要涉及药物反应,RNA聚合酶Ⅱ启动子转录的正调控等91条GO生物学过程,KEGG通路显著富集到癌症通路、乙型肝炎等66条通路,与前述疾病分析结果相符.  相似文献   

15.
该研究利用加权基因共表达网络分析(WGCNA)探讨茯苓抗食管癌的潜在作用靶点,为食管癌的临床诊治开创新思路.首先在中药系统药理学数据库与分析平台(TCMSP)数据库中筛选出茯苓的有效活性成分及对应靶点,运用Cytoscape软件中鉴定候选药物作用靶点,接着在癌症基因组图谱(TCGA)数据库和基因表达谱差异(GEO)数据库中下载肿瘤相关基因表达数据集,通过WGCNA鉴定出与食管癌紧密相关的基因,并将鉴定出的基因与茯苓的候选药物作用靶点进行比对,确定茯苓抗食管癌的潜在作用靶点,最后采用RT-PCR的方法对筛选出核心基因在人食管癌细胞中的表达量进行检测.结果共获得34种茯苓有效活性成分,及17个对应靶点,主要候选药物作用靶点为:CHRM1、NCOA2、PGR、ADRA1B、ADH1B、PTGS2.其中ADH1B为茯苓抗食管癌的潜在作用靶点.筛选出DLGAP5、MCM2、CCNA2、CDK1、TPX2、TRIP13、KIF23、KIF2C、CENPF、CHAF1A等10个核心基因,其中CHAF1A和MCM2的表达水平对食管癌患者的预后具有影响.RT-PCR结果显示,CDK1、CHAF1A、TP...  相似文献   

16.
mRNA基因芯片表达谱为头颈肿瘤(head and neck cancer,HNC)的分子生物学诊断及研究HNC的生物过程提供了诸多重要生物学信息。通过生物信息学技术研究HNC基因表达谱,从而发掘头颈癌新的分子标志物。对4个GSE数据集和癌症基因组图谱(cancer genome atlas,TCGA)头颈癌数据库进行了综合分析,鉴定出HNC和相邻正常组织(adjacent normal tissue,ANT)样本中3 639个差异表达基因(differentially expressed genes,DEGs),然后应用加权基因共表达网络分析相关差异表达基因DEGs和HNC临床特征之间的关系。鉴定出15个共表达基因模块。其中蓝绿色基因模块所对应HNC患者的风险比(hazard ratio,HR)最高。通过对该模块的进一步研究,发现氧化低密度脂蛋白1(oxidized low density lipoprotein receptor 1,OLR1)的表达量与HNC患者的总体生存率呈显著负相关性。OLR1在mRNA水平的表达水平可作为判断HNC患者生存预后的潜在分子标志物。  相似文献   

17.
目的:探索有氧运动对代谢综合征患者血液基因表达的影响,分析运动前后血液转录表达谱的差异,研究差异表达基因涉及的功能与内在联系.方法:从美国国立生物技术信息中心(NCBI)公共基因芯片数据平台(GEO)下载GSE10540数据集mRNA芯片数据,对5名代谢综合征患者运动前后的mRNA表达谱数据进行基因集富集分析(GSEA),应用metascape软件进行功能富集(GO)和信号通路(KEGG)富集分析,用STRING数据库构建蛋白质相互作用网络.结果:运动后血样比较运动前共筛选出152个差异表达基因(differentially expressed genes, DEGs),其中有54个基因上调,98个显著下调.GESA分析发现12个基因或通路在运动后表达谱中显著富集负相关,蛋白质相互作用网络筛选出9个关键蛋白.结论:代谢综合征患者运动前后血样相关DEGs揭示了代谢综合征的分子特征,这些基因可能与癌症发生之间呈负相关,这为进一步探讨有氧运动对代谢综合征患者健康改善的作用机制及关键调控分子提供了研究思路.  相似文献   

18.
基因芯片技术是随着“人类基因组计划”的进展而发展起来的,是融微电子学、生物学、物理学、化学、计算机科学为一体的新技术.现已在DNA测序、基因表达分析、新基因的发现、基因单核苷酸多态性(SNPs)研究、基因诊断、药物筛选和药物开发、环境科学等领域得到了广泛的应用,发展前景十分广阔.  相似文献   

19.
前列腺癌(Prostate Cancer,PCa)是老年男性最常见的恶性肿瘤之一.全基因组关联研究(Genome wide Association Studies,GWAS)发现SNP(Single Nucleotide Polymorphism)位点rs1741708与前列腺癌高风险性相关.表观遗传学标志物和荧光素酶报告子研究证实含有该风险性位点的染色体区段是等位基因特异性的增强子元件.敲除风险性增强子会导致细胞迁移能力减弱.利用Capture-C揭示该增强子在全基因组范围内的互作基因座位,结合风险性增强子敲除后基因表达的改变,鉴定出一些该增强子的直接靶基因.初步的Rescue研究发现,在敲除细胞中过表达靶基因IKZF3后,细胞迁移能力得到部分恢复,提示IKZF3是含有SNP rs1741708的风险性增强子影响肿瘤恶性进展的下游靶基因之一.  相似文献   

20.
乳腺癌(Breast Cancer, BC)作为女性最常见的恶性肿瘤迄今为止起因尚不明确,近年来针对单个基因或单条信号通路(pathway)的研究难以分析疾病的复杂发病机理。考虑到信号传导通路之间普遍存在相互关联和相互串扰的分子生物学特性,本文从基因之间的关联性出发,首先基于互信息(Mutual Information,MI)算法提取出了BC患病和健康对照样本中关联度具有明显变化的基因作为特征基因,在此基础上,基于KEGG通路分析获取特征基因所涉及的信号传导通路,并利用距离相关性(Distance Correlation,DC)算法度量它们之间的串扰关系,最终探寻到26条BC患病前后串扰关系变化较大的通路,通过生物学分析得到:胰岛素信号通路(Insulin signaling pathway)、I型糖尿病信号通路(Type I diabetes mellitus pathway)、核糖体(Ribosome pathway)信号通路等通路间的串扰及特征基因的显著变化对BC的发生和发展具有重要的推动作用,研究结果为探寻BC的致病机理提供了新的思路和有益的支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号