首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

2.
胰腺导管腺癌(PDAC)是全球高致死率癌症中的一种.PDAC基因生物标记的识别可以通过构建基因互作网络完成.利用蛋白质互作网络来分析与研究基因表达芯片数据,构建出PDAC基因互作网络并对其划分基因模块,进而筛选出在模块中的PDAC差异性表达基因.通过筛选在癌症样本和正常组织样本中共表达的基因对,并利用STRING蛋白质互作网络评估基因功能相关性,构建出具有PDAC特异性的基因互作网络.利用iNP算法进行网络模块化分,在每一个模块中,模块内基因都具有强的共表达特性和模块功能相关性.通过筛选,获得了34个基因模块,其中20个在癌症样本中表达明显上调,14个在癌症样本中表达明显下调.从这些模块中又筛选出在PDAC样本中表达上调的10个基因生物标记,如DMBT1、DSC3等和表达下调的10个基因生物标记,如DLG5、NRCAM等.  相似文献   

3.
三种舌运动类型的基因互作   总被引:2,自引:0,他引:2  
对72个家系1065人的3种舌运动类型进行了分析.结果表明,卷舌、翻舌和尖舌之间分别存在基因互作现象,翻舌基因(tt)的表达有赖于卷舌基因(R_)和(或)尖舌基因(P_)的存在,卷舌基因、尖舌基因对翻舌基因均具有隐性上位作用.  相似文献   

4.
一种基于信息增益的分类规则挖掘算法   总被引:2,自引:0,他引:2  
提出了一种基于信息增益的分类规则挖掘算法.该算法主要包括决策树的构造、分类规则的提取、规则兴趣度度量3步.结合一个具体的例子,解释了使用该算法来挖掘分类规则的基本过程.  相似文献   

5.
微管是一种具有极性的、管状的细胞内动态结构,是细胞骨架的重要组分.一些跟微管相关的基因发生突变时,有可能致使严重的人类疾病的发生.这些相关基因编码的蛋白即为微管互作蛋白.影响微管的基因众多,目前发现的影响微管正常组装的蛋白还只是冰山一角,仍有诸多影响微管的互作蛋白等待人类“挖掘”.我们利用已有的果蝇RNAi文库,通过UAS/Gal4系统,对部分基因进行敲减(RNAi),使基因在果蝇幼虫肌肉中特异性沉默,经过免疫染色后观察这些基因功能敲降果蝇的肌肉微管形态,以此来筛选微管互作蛋白.我们共鉴定了541个基因,筛选出微管有表型的40个.其中一些基因在线粒体、内质网、高尔基体、过氧化物酶体等细胞器中具有特定的功能.因此,我们的筛选工作不仅为构建微管相关疾病模型提供了铺垫,为微管相关疾病治疗工作提供了一定的帮助;而且对细胞结构中微管的非中心体微管组织中心探究提供了思路.  相似文献   

6.
基于信息增益及归因理论,结合矩阵表示方法,建立了征信数据的关联规则挖掘模型,以解决征信数据关联规则挖掘模型的变量权重确定及变量取值的影响度问题.该模型提高了其决策结果的准确性和科学性,决策效率得到提升.  相似文献   

7.
在现有的对于属性选择所做工作的基础上,提出了一种基于信息增益和遗传算法的属性选择方法。通过实验结果与其他的属性选择方法的比较,发现这种基于最基于信息增益和遗传算法的属性选择方法能够从一定程度上提高属性选择算法的效率。  相似文献   

8.
漂盘培育云烟87和三生烟,苗期接种TMV后0h,12h,24h,36h,48h,60h和72h分别取样测定其叶片和根系中PAL的活性,并以未接种TMV烟苗叶片和根系中PAL的活性为对照.结果表明:烟草与TMV非亲和性互作时,叶片和根系中PAL活性上升速度比烟草与TMV亲和性互作时PAL活性上升速度快;烟草与TMV无论是亲和性互作还是非亲和性互作,烟草叶片中PAL活性升高速度快于根系中PAL活性上升速度.  相似文献   

9.
漂盘培育云烟87和三生烟,苗期接种TMV后0h,12h,24h,36h,48h,60h和72h分别取样测定其叶片和根系中PAL的活性,并以未接种TMV烟苗叶片和根系中PAL的活性为对照.结果表明:烟草与TMV非亲和性互作时,叶片和根系中PAL活性上升速度比烟草与TMV亲和性互作时PAL活性上升速度快;烟草与TMV无论是亲和性互作还是非亲和性互作,烟草叶片中PAL活性升高速度快于根系中PAL活性上升速度.  相似文献   

10.
信息增益是最有效的特征选择方法之一,但在处理不平衡数据集时其分类性能却急剧下降。针对这一不足,文章从三个方面对传统信息增益进行改进,提出一种改进的信息增益特征选择方法。首先,去除特征项不出现因子以降低对分类的干扰;其次,引入最大词频比因子以抑制低频词的干扰;最后,融入类内词频分布差异离散度和类间分布差异加权离散度因子以衡量特征项在类内和类间的分布差异。在不平衡数据集上的实验结果表明,改进的信息增益不仅可以从很大程度上改善少数类的分类性能,也使总体分类性能得到了明显提升。  相似文献   

11.
12.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

13.
14.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

15.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

16.
真菌与昆虫是自然界存在的两个最大生物类群.两者在漫长的进化过程中逐渐形成了复杂而密切关系,无论在昆虫的体表还是昆虫的体内,都存在着丰富的真菌类群.许多昆虫都与真菌间形成了互惠的共生关系,因而才得以更好的利用资源、适应环境和占领新的生境.研究真菌和昆虫的互作和协同进化对于我们认识生物多样性的形成、物种的分化、生物地理分布等有着重要意义.  相似文献   

17.
本文以挖掘决策者信息作为切入点,针对含参数优先权重的参数确定问题,提出了依据决策者偏好确定参数的3种方法,使得决策结果更能体现决策者的偏好.最后通过算例说明方法的可行性和有效性.  相似文献   

18.
19.
为文本情感分类提出一种改进的机器学习算法。在分析当前主要文本特征选择方法后,把词频和词语情感表现程度融入到信息增益特征选择方法中,从全局和局部2个方面进行特征权重衡量,使用特征空间向量模型对文本进行统一表示,然后利用SVM算法进行训练学习。通过实验发现该算法的查准率和查全率比传统的机器学习算法有所提高,并且得到的分类器具有较好的泛化能力。  相似文献   

20.
【目的】使用酵母双杂交系统研究刚毛柽柳中获得的2CysPrx(硫氧还蛋白过氧化物酶)基因(命名为Th2CysPrx)及编码蛋白的功能。【方法】通过酵母双杂交系统对该基因编码蛋白的互作蛋白进行筛选,进一步利用qRT-PCR 技术分析NaCl 和PEG6000 胁迫下刚毛柽柳叶组织和根部组织中Th2CysPrx 基因与其互作蛋白基因的表达模式。【结果】酵母双杂交系统筛选获得了4 个可能与Th2CysPrx 互作的蛋白,分别为丙氨酸-乙醛酸转氨酶2(alanine-glyoxylate aminotransferase 2,ThAGT2)、苹果酸脱氢酶(malate dehydrogenase,ThMDH)、黄酮醇合酶(flavonol synthase,ThFLS)和扩展蛋白(expansin,ThEXP)。基因表达分析结果显示:盐胁迫下,柽柳叶和根中,Th2CysPrxThAGT2 基因的表达模式基本一致; 而干旱胁迫下,Th2CysPrxThAGT2 基因在叶和根中具有相同的表达模式。【结论】在盐和干旱胁迫下,ThAGT2 基因与Th2CysPrx 表达模式均趋于一致,表明Th2CysPrx 基因均可能通过与ThAGT2 基因的互作共同参与抗逆过程,为进一步研究Th2CysPrx 基因的抗逆机制,以及与其他抗逆基因的关系提供了依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号