首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为解决癌症基因组图谱中DNA甲基化数据不平衡导致假阴率上升的问题,提出一种基于TCGA数据库不平衡数据的改进分类方法.使用合成少数类过采样技术和Tomek Link算法进行混合采样,解决数据不平衡问题.在此基础上,将经特征选择后的训练集数据输入改进模型进行训练、学习及分类.基于TCGA数据库6种癌症DNA甲基化数据的实验结果表明:改进方法对少数类样本的分类性能有显著提高,对多数类样本的分类性能也有一定的提升.  相似文献   

2.
利用生物信息学方法,深入分析TCGA基因组数据库,利用数据库的前列腺癌全转录组数据构建前列腺癌的风险模型.对TCGA数据库收录的492例前列腺癌癌组织和52例癌旁组织做基因差异分析,筛选出差异基因后进一步对上调基因做GO功能富集分析和KEGG通路富集分析.以上调最明显的10个基因做为候选基因,进一步分析各基因对前列腺癌患者预后的影响.最后,使用COX风险回归模型,构建多基因的COX回归风险模型.结果表明基因表达差异分析共筛选表达上调基因1978个,下调基因1644个.其中上调最明显的基因为:PCA3、AMACR、MTND4P12、RNY3P8、DLX1、OR51E2、PCAT14、GOLM1、HPN、GLYATL1.生存分析结果提示高表达 PCA3、MTND4P12、RNY3P8、OR51E2、PCAT14、GOLM1 均提示前列腺癌预后不良.基于上述6个基因,构建的风险模型对前列腺癌风险具有良好的预测精度.可筛选出前列腺癌患者中高风险的患者.PCA3、MTND4P12、RNY3P8、OR51E2、PCAT14、GOLM1在前列腺癌组织中高表达,且高表达该基因提示预后不良.提示,上述基因可能在前列腺癌的发生、发展中发挥重要的作用.  相似文献   

3.
将LabSQL数据库访问工具包应用于某电力谐波监测系统的数据库管理中,采用ODBC接口方式访问Microsoft Access数据库,构建起集数据存储、分析和处理于一体的数据管理平台. 实验表明,LabSQL数据库访问工具包可满足现场电力数据存储与分析、快速分类与检索信息的需要.  相似文献   

4.
目的:IgA肾病(IgAN)是引起终末期肾病(ESRD)最常见的原发性肾小球肾炎,其潜在发病机制和关键基因有待深入地探索,本研究旨在确定IgAN发病的关键基因.方法:从高通量功能基因组(GEO)数据库中获取IgAN相关表达谱芯片GSE93798和GSE37460,筛选出两个数据集中共同的差异基因.通过基因本体论(GO)...  相似文献   

5.
目的 基于GEO数据库和转录因子调控网络筛选抗结核病药物及药物作用靶点。方法 通过NCBI的GEO数据库,筛选结核病患者和健康者之间差异表达的基因;通过AnimalTFDB 3.0数据库预测差异表达基因中的转录因子,并构建转录因子调控网络;通过调控网络中的关键基因筛选相关miRNA,并筛选关键节点,初步阐明结核病致病的分子机制。结果 通过GEO数据库检索,筛选出的差异表达基因为784个;通过AnimalTFDB 3.0数据库筛选出23个转录因子和对应的790个靶基因,构建了转录因子-靶基因的调控网络;通过TargetScanHuman 7.2查询到关键节点对应的miRNA,构建“转录因子-靶基因-miRNA”调控网络,筛选出4个结核病药物靶点(EP300,CREBBP,ELAVL1,HSP90AA1),阐明了其与转录因子和miRNA之间的调控机制。结论 通过构建结核“转录因子-靶基因-miRNA”网络,筛选出结核病新的潜在药物作用靶点——EP300、CREBBP、ELAVL1、HSP90AA1;同时发现,EP300、CREBBP、HSP90AA1通过激活转录因子STAT2,导致机体内炎...  相似文献   

6.
按Gone Ontology基因功能分类体系,将基因模块化地组织成具有显著生物意义的低维功能模块单元,并将其作为新的分析指标用于分类微阵列疾病样本,从而提出了基于功能表达谱的聚类分析新途径、采用NCI60数据集,通过功能表达谱对组织样本进行聚类分析.结果显示,新算法不但得到高准确度的样本分型结果,而且能够直接从功能水平上给出相应的生物学解释.同时,用基于功能表达谱对组织样本进行聚类分析可以显著降低特征维数,有效地处理高检测误差与基因表达变异问题.  相似文献   

7.
目前.对于微饥数据库dBASE自含主语言中存在功能不足的问题已有不少解决方法,但大多数局限于与高级语言进行数据文件对接.只能局部地增加主语言的功能.本文参照大型数据库的构造方式.直接选用已有的高级语言作为主语言,从而使dBASEⅢ具有绘图、通信、进行复杂计算等功能.文中给出了一个dBASE Ⅲ以GWBASIC为主语言的实例.  相似文献   

8.
【目的】探讨葡萄糖和甘油碳源对大肠杆菌(Escherichia coli)基因表达谱的影响。【方法】通过基因表达数据库GEO下载基因芯片数据集GSE2037和高通量测序数据集GSE156143,分别对两个数据集中的葡萄糖和甘油碳源样本进行差异表达基因筛选,对筛选到的差异表达基因进行并集后,进行GO功能富集分析、KEGG通路富集分析以及蛋白质相互作用网络构建。【结果】筛选出701个差异表达基因,差异表达基因主要富集于小分子分解代谢过程、碳水化合物运输、趋化性等生物学过程,细胞器、细菌型鞭毛、甲基接受趋化蛋白复合物等细胞组分,离子跨膜转运蛋白活性、碳水化合物结合、肌动活动等分子功能以及不同环境中的微生物代谢和ABC转运体相关通路。此外,筛选出的14个核心基因在鞭毛合成和趋化中发挥作用。【结论】大肠杆菌在葡萄糖和甘油碳源培养条件下具有不同的基因表达模式,所确定的14种与趋化和鞭毛合成有关的基因有助于进一步揭示大肠杆菌在应对不同营养环境变化时采取的分子调控机制。  相似文献   

9.
选取了10个物种与本课题组前期克隆得到的东北七鳃鳗抗增殖蛋白2(Lm-PHB2)进行氨基酸序列相似性对比,检测PHB2基因进化水平,结果表明各物种的PHB2氨基酸序列在PHB结构域处高度保守,但在N-端和C-端氨基酸序列保守性较低.将重组质粒pEGFP-N1-Lm-PHB2瞬时转染入张氏肝(CHL)细胞后,利用基因表达谱芯片技术分析基因的表达差异.结果显示CHL细胞中共有270条显著差异表达基因,其中显著上调基因共141条,显著下调基因共129条,涉及细胞信号转导、细胞周期调节、细胞增殖、细胞代谢和细胞凋亡等多个方面.通过实时荧光定量聚合酶链式反应(PCR)对基因表达谱芯片分析结果进行验证,结果显示转染pEGFP-N1-Lm-PHB2质粒后,细胞周期基因CDC25C、氧化应激相关基因(CAT,SOD,GST)和抗细胞凋亡基因HAX1均有显著性差异.  相似文献   

10.
11.
基于教学管理系统的数据库及其完整性的设计与实现   总被引:1,自引:0,他引:1  
目的为了防止教学管理系统数据库中出现不正确和不相容的数据,给出了该系统数据库及其完整性约束的具体设计与实现方法。方法通过数据库规范化设计方法对教学管理系统数据库建模,给出了教学管理系统从数据库需求分析到概要设计过程中的E—R图,再到逻辑设计的关系模式。结果给出了数据库完整性在教学管理数据库设计中的实现方法。结论通过对教学管理系统数据库完整性的设计与实现,提高了教学管理应用系统的开发与使用性能。  相似文献   

12.
提出了一种新型的地图数据库语言MQL,它是传统的标准SQL语言的扩充,讨论了MQL的设计思想,功能特色与使用方式,该语言现成功地应用地图数据库管理系统MDB中。  相似文献   

13.
针对Web Services安全性,提出一个基于简单对象访问协议(Simple Object Access Protocol,SOAP)的安全工具包,由安全信息处理、授权信息处理、签字处理、加密处理、认证信息处理等5个部分组成,并对安全信息处理、授权信息处理给出了详细设计与实现.  相似文献   

14.
针对NCA算法对初始值敏感的不足,提出一种改进的NCA算法(INCA).INCA对肿瘤基因表达谱进行奇异值分解,将标准化后的右奇异矩阵作为初始值,提取肿瘤基因表达谱中的分类信息.在4个标准肿瘤基因表达谱数据集上进行实验,以INCA作为特征提取方法,K-近邻、Parzen窗作为分类器进行分类检测.实验结果表明,与NCA及现有的分类模型相比,基于INCA的分类模型能够取得较高的分类准确率.  相似文献   

15.
基于XML的异质多数据库集成系统的设计与实现   总被引:2,自引:0,他引:2  
目前由于各厂商数据库产品之间的差异,对多种异质数据库的访问存在较大障碍,影响了在Web服务体系框架下信息的统一交换与共享.本文通过分析目前较流行的XML文件同关系型数据库之间的转换算法,提出了一套可行的映射方案,实现了关系型数据库数据与XML文件数据的双向转换.同时屏蔽各种数据库之间的差异,支持各种数据库的数据类型,实现了多数据库的统一访问和数据集成.  相似文献   

16.
提出一种新型的地图数据库语言MQL,它是传统的标准SQL语言的扩充.讨论了MQL的设计思想、功能特色与使用方式.该语言现已成功地应用到地图数据库管理系统MDB中  相似文献   

17.
基因芯片技术在肿瘤分型分类的研究中得到了广泛的应用.为了处理肿瘤基因表达谱数据,建立肿瘤分类预测模型,文中采用基因表达差异显著性分析方法,支持向量机,遗传算法相结合的多步骤降维分类方法.采用该方法处理大肠癌和白血病数据集,筛选到基因数量较少并且分类准确度较高的特征基因子集.实验结果表明,文中的方法可以快速有效地筛选肿瘤特征基因,获得更好的分类效果.  相似文献   

18.
提出一种基于遗传算法的数据挖掘方法——TGASVM,它能够尽可能少地选出分类能力强的信息基因.实验表明与同类的算法相比,TGASVM算法无论是分类准确率,还是挑选信息基因数目都优于同类算法.  相似文献   

19.
以Jigsaw为代理服务器,对如何以数据库方式缓存Web信息作了分析与设计,并对数据库方式和文件方式的Web Cache进行了比较.进一步讨论了数据库方式Web Cache的改进方案.  相似文献   

20.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号