首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
分类集及极大分类集的计数   总被引:1,自引:0,他引:1  
M是(1,2,…,n)的一些子集合的集合。若M中任意两个子集,或者它们无共同元素,或者一个是另一个的子集,这样的M称为分类集。若不存在(1,2,…,n)的一个分类集包含M,称M为极大分类集。给出分类集及极大分类集个数tn及Tn的计算,并由Tn的两个递推关系式得到一些组合恒等式。  相似文献   

2.
不平衡数据的分类是机器学习的热点问题.传统的分类方法在分类时会倾向于多数类而使得分类精度不高.对不平衡数据集的分类,提出一种基于FCM结合KFDA方法,首先采用FCM算法对样本数据进行聚类,将数据聚类后的样本数据映射到特征空间里,再采用KFDA算法对数据进行分类,可以克服不平衡数据对分类性能的影响.对UCI数据集进行仿真实验,结果表明FCM-KFDA算法可以有效地提高数据识别率.  相似文献   

3.
李作春  周秀梅  覃泽 《科技咨询导报》2009,(28):236-237,239
针对存在的关联规则挖掘算法不能有效地在异质数据集中进行,本文首先使用领域本体方法处理数据集中的异质现象,然后提出了一种有效的XML异质数据集关联规则挖掘算法,实验结果表明该算法在挖掘速度和挖掘时在对内存的占用方面都优于现有的算法。  相似文献   

4.
5.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

6.
近年来,面向不平衡数据集的分类器学习与推广问题越来越受到人们的关注,在此以机器学习数据库、美国邮政编码、2维元音等国际上典型的分类问题为应用背景,重点研究如何用线性分类器解决样本数不平衡的问题;对Fisher、伪逆和单层感知器等3种典型的线性分类器做了深入的研究,并将这3种线性分类方法应用到不平衡数据集的分类中;通过实验及分析,这些新方法对平衡数据集的线性分类起到了良好的分类效果。  相似文献   

7.
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余.实验结果表明,新方法可有效提高分类准确率和特征选取的效率.  相似文献   

8.
针对多类高维基因表达谱的特点,提出一种基于闭合模式的多类分类算法CBCP,即根据垂直格式的数据集采用路径枚举的方法挖掘闭合模式,极大地减少了冗余模式的产生.然后,对所有闭合模式进行排序,通过覆盖训练集建立分类器.针对分类器无法识别的样本提出权重算法进行判断,克服了使用Default类预测不精确的问题.研究结果表明,CBCP与经典分类算法如CBA和C4.5相比具有更高的预测准确率,并且在基因数大幅增加而样本数不变的情况下仍具有较强的稳定性,证明CBCP的可扩展性强,适用于高维数据集的多类分类预测.  相似文献   

9.
对于多指标数据的分类,通常将其投影到平面上,然后根据投影点的聚焦程度确定多指标数据的类别,分类的效果取决于权数的选取。利用广义最小二乘模型对多指标数据的权数进行了计算,进而实现对多指标数据的分类。  相似文献   

10.
通过对环境背景数据分类编码进行研究,形成如下主要结论:以环境背景数据为研究对象,在综合考察数据对象的地学基础、语义时间、存储格式、记载介质、负责机构、专题信息等属性特征的基础上,提出完整的环境背景数据概念;在以地球信息科学为技术支撑的陆地系统科学中,强调环境背景数据的分类编码应侧重从宏观角度实现环境背景数据的发现,“综合为体,分类为用”是环境背景数据分类及编码的意义所在;结合国家标准《地理数据-元数据》的具体实施,着重讨论分类编码的贯彻实施应以元数据为标准载体,在统一的环境背景数据分类编码一时无法确定的阶段,可以利用核心元数据中的关键字字段实现分类编码的间接引用,确保元数据标准对不同系列分类编码的兼容并包.  相似文献   

11.
使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性.  相似文献   

12.
基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上.  相似文献   

13.
利用RI-PCR方法从培养的人黑色素瘤细胞系A375中扩增得到了人血管生成素cDNA片段,测序正确后克隆入表达载体pET-28a( )中并转化于E.coli BL21宿主菌中.经IPTG诱导,表达了N端融合6个组氨酸标签(6His-tag)的血管生成素融合蛋白.利用6His-tag与过渡态金属离子Ni2 高亲和力结合的性质,经镍柱纯化,获得了高纯度的血管生成素融合蛋白,为进一步研究其生物活性及应用奠定了基础.  相似文献   

14.
Using gene expression data to discriminate tumor from the normal ones is a powerful method. However, it is sometimes difficult because the gene expression data are in high dimension and the object number of the data sets is very small. The key technique is to find a new gene expression profiling that can provide understanding and insight into tumor related cellular processes. In this paper, we propose a new feature extraction method based on variance to the center of the class and employ the support vector machine to recognize the gene data either normal or tumor. Two tumor data sets are used to demonstrate the effectiveness of our methods. The results show that the performance has been significantly improved.  相似文献   

15.
16.
目的 :探讨端粒酶基因表达与癌细胞生物学行为及其端粒酶活性关系。方法 :用原位杂交的方法检测端粒酶基因 h TR和 h TRT在 1 1 5例癌组织 ,2 3例癌前病变 ,2 0例良性病变中的表达情况。结果 :1 1 5例癌中 h TR阳性率为 83.5 % ,h TRT阳性率为 80 .9% ;2 3例癌前病变中 h TR、h TRT阳性率分别为 39.1 %和 30 .4% ;2 0例良性病变中除 1例有 h TRT弱阳性外其余均为阴性。癌组织 h TR和 h TRT的表达与癌前病变、良性病变比较有显著性差异 ( p<0 .0 1 ) ,而癌组间无差异。h TR、h TRT表达在淋巴结转移癌组明显高于无转移组 ,端粒酶基因表达随肿瘤分化程度降低而有增高的趋势。结论 :端粒酶基因 h TR和 h TRT在多种癌及癌前病变组织中均为高表达且有很大相关性。端粒酶的激活发生在癌变早期 ,提示与癌的发生、发展密切相关。原位杂交技术检测h TR和 h TRT对恶性肿瘤诊断具有重要意义  相似文献   

17.
通过献资料法阐述了运动对骨骼肌基因表达的影响,以便深入理解骨骼肌的工作原理,为客观指导运动训练提供依据.  相似文献   

18.
Extracellular xylanase XYNB from Streptomyces olivaeeoviridis A1 has been purified and characterized.The optimal pH value and temperature of XYNB for its activity are 5.2 and 60℃, respectively. The specific activity of XYNB is as high as 2869.78 U/mg. Metal cations, EDTA and SDS have no effects on enzyme activity of XYNB. The gene xynB coding mature protein of XYNB has been cloned by PCR. The forward oligonucleotide primer used in the PCR reaction was synthesized based on the N-terminal amino acid sequence of XYNB mature protein, and the reverse oligonucleotide primers are random oligonucleotide. The cloned gene xynB is 576 bp long and its G C content is 64.3%. The xynB encodes 191 amino acid residues, and the putative molecular weight of XYNB is 20.839 kD. The xynB has been expressed in E. coli, and the expressed xylanase has normal bioactivity.  相似文献   

19.
Progress in artificial control system for gene expression   总被引:2,自引:0,他引:2  
Along with the increasingly wide application of transgenic techniques, new stricter criteria have been raised for controlling the expression of exogenous genes. For these demands, a series of artificial control systems for gene expression have been developed and testified in recent years, which can control exogenous genes expression in exact time and certain level by administration of a specific drug or hormone. The successful construction of these systems offers a practicable method to control precise expression of exogenous gene in organisms, and raises the feasibility of wide application of gene therapy.  相似文献   

20.
A new method designated cDNA array was developed by hybridization of quantitatively arrayed DNA samples isolated randomly from a cDNA library with probes reverse-transcribed from mRNAs of different sources or treatments. The gene expression patterns of 1 000 randomly chosen clones from an Arabidopsis library were analyzed with green seedlings versus suspension cells and seedlings irradiated under UV light. Northern blot and sequence analysis of some differentially expressed clones confirmed the results revealed by cDNA array, indicating that this method is efficient and reliable to monitor gene expression.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号