首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于类别空间的基因选择   总被引:5,自引:0,他引:5  
基因选择通常是在基因空间中进行的. 由于基因空间的维数(基因数目)比该空间中的样本数要多得多, 这种做法存在严重的维数发难(curse of dimensionality)问题, 其结果是在基因空间中所建立数据模型难于获得满意的精度, 基于所建立模型的基因选择结果可信度低. 如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题. 将基因空间变换为它的对偶空间, 称为类别空间, 从而空间的维数仅为基因空间中样本的类别数, 空间中的样本数则为基因空间的维数. 显然, 在类别空间中不存在任何维数发难现象; 提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法. 对真实基因数据的基因选择实验, 并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标, 与其他两种基因选择方法进行了深入的比较, 结果表明该方法是十分有效的.  相似文献   

2.
通过对OWL2语法结构和推理方式的分析,提出OWL2基本元素和公理在关系数据库中的存储结构和推理实现方式.将部分推理结果在数据库中进行存储,提高了本体存储和推理的效率,并能对大规模的本体进行存储.通过构建知识管理平台验证了该存储方式的有效性.  相似文献   

3.
在高速骨干网环境中,由于受到计算和存储资源的限制,准确、及时地识别大流量对象对于检测大规模网络安全事件具有重要意义.文中使用相对流量大小定义大流,即对于一个给定的阈值φ(0<φ<1),将所有与链路实际传输总流量的比值超过φ的流定义为大流.在该定义下,大流量对象的识别问题等价于带权值数据流中的频繁项挖掘问题.由于骨干网链路速度快,对单个数据包的处理必须在纳秒级完成,因此对算法的实时性要求更高.在带权值数据流的频繁项挖掘中,目前没有对单数据项最坏处理时间为O(1)的算法.文中提出一个新的带权值数据流频繁项挖掘算法WLC,能够提供单数据项最坏处理时间为O(1)的处理速度.WLC采用一个部分排序的数据结构POSS,能够在保证处理速度的同时,尽量降低算法的存储开销.通过实际的互联网数据进行对比实验,结果表明:与现有的算法相比,WLC具有更快的处理速度,同时算法的实际存储开销远小于其理论上界.  相似文献   

4.
耳聋是最常见感觉障碍之一,与遗传关系密切.SLC26A4基因作为第二位的耳聋基因,与Pendred综合征(PS)和非综合征性聋DFNB4密切相关.SLC26A4基因突变主要与PS及DFNB4共同表现出的前庭水管扩大(EVA)相关,且不同种族及地区EVA患者该基因的突变频率及热点突变大不相同.SLC26A4基因的表现型与突变的类型关系不大,而是与等位基因数目相关.但目前SLC26A4基因突变的研究仍不完善.本文主要综述了近年来耳聋及SLC26A4基因的研究进展.  相似文献   

5.
脊椎动物基因注释中的大基因问题   总被引:2,自引:0,他引:2  
为了找出编码蛋白质的基因,注释流程结合了“从头开始的基因预测方法”和“与已知基因相似性比较”这两种方法。“从头开始的基因预测方法”虽然有很高的假阳性但是假阴性却很低;相形之下,结合了相似性比对的方法之后虽然能够降低假阳性,但是却大大提高了假阴性。我们发现,在这当中与基因预测正确率相关的最重要因素就是基因大小(包括内含子在内)——大基因尤其容易产生预测错误。  相似文献   

6.
基因转移的研究进展   总被引:5,自引:3,他引:2  
本文从新的思路上介绍了基因转移的研究进展,首先论述了有性杂交与基因交流和物种进化的关系,重点论述了非有性杂交条件下生物体间、生物体内的基因水平转移研究概况,并讨论了基因转移与生物进化,突变和生物工程的关系及存在的有关问题。  相似文献   

7.
转抗旱基因作物的研究进展   总被引:14,自引:0,他引:14  
在烟草中已分别进行过与抗旱有拳甘露糖醇-1-磷酰脱氢酶基因,甜菜碱脱氢酶基因,二氢吡咯-5-羧酸酶基因,晚期胚胎发生丰富蛋白基因,海藻糖合成酶基因,过氧化物酶基因的转抗旱基因烟草的研究。转Mn-SOD cDNA的转基因苜蓿,表现了较强抗寒性和抗旱性。  相似文献   

8.
忆阻器具有依赖于激励历史的动态电阻,可以用来构造少晶体管的非易失性半导体存储器(NVSM),也称为阻变随机存取存储器(RRAM).本文提出了一种基于忆阻器的阻变随机存取存储器(MRRAM)——可与现代计算系统相兼容的纳米级二值存储器实现方案,其结构与静态随机存取存储器(SRAM)类似,但用忆阻器替代基本RS触发器存储信息.在此基础上,通过改进该MRRAM,可以实现在一个存储单元中存储多比特信息(以灰度级形式)的多值存储器,大大提高了存储密度.给出的计算机仿真和数值分析验证了本方案在存储ASCII字符和图像中的有效性,探讨了灰度图像存储的新方法.  相似文献   

9.
结合复杂数据分析(Complex Data Analysis)理论和充分降维的思想,在有效提取结肠癌特征基因研究的基础上,建立结肠癌特征基因提取的BB-SIR模型。该模型方法简洁易懂且有较高的识别率。依据BB-SIR模型和所给数据找到了两个结肠癌亚型,并确定了该亚型的特征基因。实验结果表明,BB—SIR方法选出的特征基因能够识别出结肠癌亚型,并且识别正确率达到96%以上。  相似文献   

10.
小麦转基因研究现状及展望   总被引:3,自引:0,他引:3  
自二十世纪八十年代开始研究转基因植物以来,小麦作为世界主要粮食来源,其转基因遗传改良受到科学家的广泛关注。目前国内外已有近200例外源基因,主要是抗除草剂类基因、抗病虫基因、品质基因、抗旱耐盐等抗逆基因、雄性不育类基因等,通过基因枪法、农杆菌介导法、花粉管通道法等技术转入小麦的报道。从转单基因到进行多基因组装,从改良各种生物胁迫和非生物胁迫的抗逆性,到改良品质、高产等生理和农艺性状,是未来转基因小麦的研究方向。本文就近二十几年来转基因小麦研究进展及存在问题进行了全面系统的综述和探讨。  相似文献   

11.
12.
13.
数据挖掘和国际互联网是信息社会两大重要而有意义的领域。这两个领域的结合就是网络挖掘。网络挖掘一般可以分为两种不同的方法:一是网络内容挖掘,即从互联网的各种资源中检索和提取信息的过程;二是网络使用挖掘,指挖掘网站访问方式或其他网络用户信息的过程。本文主要讨论了WEB网络挖掘,包括有关网络挖掘的多种研究问题、研究技术、研究工具以及网络内容挖掘和网络使用挖掘方面的最新进展。  相似文献   

14.
在互联网时代,爆炸式增长的数字图像不仅给图像检索带来巨大的技术挑战,同时也带来了很多机遇和研究问题的新思路.本文简单回顾了图像检索的三个阶段的研究历史.以及在此过程中数据量的增多给图像检索带来的影响,并对作为关键问题的特征提取方面的研究进行了深入的分析.本文尤其指出视觉模式挖掘是寻找中层特征表示并缩小语义鸿沟的重要研究方向,并根据视觉模式的表征粒度将其分为五种类别分别进行了介绍,从中可以看到大数据对于视觉模式挖掘的重要作用.  相似文献   

15.
Summary The proposal is made, illustrated and supported by experimental evidence that T cell-mediated immunopathology triggered initially by low- or non-cytopathic infectious agents may cause diseases, susceptibility to which is linked to the major histocompatibility gene complex.This summary is an updated version of the paper given on the occasion of the Paul Ehrlich Prize ceremonies in 1983; it was also presented at the meeting New Trends in Allergy II in München 1985, and is reproduced here with the permission of Springer Verlag, Heidelberg.  相似文献   

16.
Gene inactivation triggered by recognition between DNA repeats   总被引:15,自引:0,他引:15  
This chapter focuses on phenomena of gene inactivation resulting from the presence of repeated gene copies within the genome of plants and fungi, and on their possible relationships to homologous DNA-DNA interactions. Emphasis is given to two related premeiotic processes: Methylation Induced Premeiotically (MIP) and Repeat-Induced Point mutation (RIP) which take place in the fungiAscobolus immersus andNeurospora crassa, respectively. The relationships between these processes and genetic recombination are discussed.  相似文献   

17.
在露天矿综合管理系统中,库存管理是一个重要环节,采购存储成本占矿山流动成本的15%~20%。所以露天矿物料及设备存储的管理优化是露天采矿优化中的重点。露天矿山仓储管理的现代化是实现矿山企业管理现代化的重要一环。在其数据库应用系统的设计中,数据库的结构设计是应用系统的基础。以库存管理系统的数据库设计为例,讨论了数据库的设计方法和技术,通过需求分析、概念结构设计、逻辑结构设计等方面阐述了库存管理系统数据库设计的全过程。  相似文献   

18.
在已经解序的、数以百计的生物基因组中,存在大量编码未知功能蛋白的基因序列。同时,众多已知功能的酶蛋白在解序的基因组中找不到对应的基因。确定未知功能基因的功能和寻找孤儿酶对应的基因是后基因组时代面临的极具挑战性的科学任务。本文综合讨论了目前基因组中基因功能注释存在的问题及解决这些问题的策略与方法。  相似文献   

19.
本文主要研究通过引入滑动窗口模型,提出了面向XML查询数据流的频繁查询子树在线挖掘算法。算法以全局Trie树为数据缓存结构管理和维护缓存池的数据流,采用自下而上、基于前缀等价类的遍历方式快速产生所有带根查询子树和标准查询子树。实验结果表明该算法具有挖掘速度快、内存消耗稳定等特点,可以有效、平稳地处理XML查询数据流。  相似文献   

20.
Genomic alterations lead to cancer complexity and form a major hurdle for comprehensive understanding of the molecular mechanisms underlying oncogenesis. In this review, we describe recent advances in studying cancer-associated genes from a systems biology point of view. The integration of known cancer genes onto protein and signaling networks reveals the characteristics of cancer genes within networks. This approach shows that cancer genes often function as network hub proteins which are involved in many cellular processes and form focal nodes in information exchange between many signaling pathways. Literature mining allows constructing gene-gene networks, in which new cancer genes can be identified. The gene expression profiles of cancer cells are used for reconstructing gene regulatory networks. By doing so, genes which are involved in the regulation of cancer progression can be picked up from these networks, after which their functions can be further confirmed in the laboratory.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号