首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
分类集及极大分类集的计数   总被引:1,自引:0,他引:1  
M是(1,2,…,n)的一些子集合的集合。若M中任意两个子集,或者它们无共同元素,或者一个是另一个的子集,这样的M称为分类集。若不存在(1,2,…,n)的一个分类集包含M,称M为极大分类集。给出分类集及极大分类集个数tn及Tn的计算,并由Tn的两个递推关系式得到一些组合恒等式。  相似文献   

2.
不平衡数据的分类是机器学习的热点问题.传统的分类方法在分类时会倾向于多数类而使得分类精度不高.对不平衡数据集的分类,提出一种基于FCM结合KFDA方法,首先采用FCM算法对样本数据进行聚类,将数据聚类后的样本数据映射到特征空间里,再采用KFDA算法对数据进行分类,可以克服不平衡数据对分类性能的影响.对UCI数据集进行仿真实验,结果表明FCM-KFDA算法可以有效地提高数据识别率.  相似文献   

3.
网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用.然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务.针对上述问题,基于“收集-处理-标注”构建流程,提出一个涵盖文本语义、网页结构等多视角特征的网页数据集Web-Minds,该数据集包含600余个门户网站下的21828条网页.首先,在开放互联网中通过关键词检索采集得到相关网页数据;其次,使用网页解析工具对收集的数据中的文本、DOM结构树、关键词等多视角信息进行提取与清洗;最后,采用大语言模型与“人在回路”的联合标注策略,形成网页类型与网页主题两种标签.在此基础上,针对Web-Minds数据集,测试评估了机器学习、文本分类和网页分类多种算法,结果表明,综合利用多视角特征能有效提升算法的准确率,和仅应用单视角特征相比,在网页类型和主题分类任务上,准确率分别提升了5.49%和5.61%.  相似文献   

4.
李作春  周秀梅  覃泽 《科技咨询导报》2009,(28):236-237,239
针对存在的关联规则挖掘算法不能有效地在异质数据集中进行,本文首先使用领域本体方法处理数据集中的异质现象,然后提出了一种有效的XML异质数据集关联规则挖掘算法,实验结果表明该算法在挖掘速度和挖掘时在对内存的占用方面都优于现有的算法。  相似文献   

5.
6.
近年来,面向不平衡数据集的分类器学习与推广问题越来越受到人们的关注,在此以机器学习数据库、美国邮政编码、2维元音等国际上典型的分类问题为应用背景,重点研究如何用线性分类器解决样本数不平衡的问题;对Fisher、伪逆和单层感知器等3种典型的线性分类器做了深入的研究,并将这3种线性分类方法应用到不平衡数据集的分类中;通过实验及分析,这些新方法对平衡数据集的线性分类起到了良好的分类效果。  相似文献   

7.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

8.
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余.实验结果表明,新方法可有效提高分类准确率和特征选取的效率.  相似文献   

9.
针对多类高维基因表达谱的特点,提出一种基于闭合模式的多类分类算法CBCP,即根据垂直格式的数据集采用路径枚举的方法挖掘闭合模式,极大地减少了冗余模式的产生。然后,对所有闭合模式进行排序,通过覆盖训练集建立分类器。针对分类器无法识别的样本提出权重算法进行判断,克服了使用Default类预测不精确的问题。研究结果表明,CBCP与经典分类算法如CBA和C4.5相比具有更高的预测准确率,并且在基因数大幅增加而样本数不变的情况下仍具有较强的稳定性,证明CBCP的可扩展性强,适用于高维数据集的多类分类预测。  相似文献   

10.
对于多指标数据的分类,通常将其投影到平面上,然后根据投影点的聚焦程度确定多指标数据的类别,分类的效果取决于权数的选取。利用广义最小二乘模型对多指标数据的权数进行了计算,进而实现对多指标数据的分类。  相似文献   

11.
基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上.  相似文献   

12.
利用RI-PCR方法从培养的人黑色素瘤细胞系A375中扩增得到了人血管生成素cDNA片段,测序正确后克隆入表达载体pET-28a( )中并转化于E.coli BL21宿主菌中.经IPTG诱导,表达了N端融合6个组氨酸标签(6His-tag)的血管生成素融合蛋白.利用6His-tag与过渡态金属离子Ni2 高亲和力结合的性质,经镍柱纯化,获得了高纯度的血管生成素融合蛋白,为进一步研究其生物活性及应用奠定了基础.  相似文献   

13.
Using gene expression data to discriminate tumor from the normal ones is a powerful method. However, it is sometimes difficult because the gene expression data are in high dimension and the object number of the data sets is very small. The key technique is to find a new gene expression profiling that can provide understanding and insight into tumor related cellular processes. In this paper, we propose a new feature extraction method based on variance to the center of the class and employ the support vector machine to recognize the gene data either normal or tumor. Two tumor data sets are used to demonstrate the effectiveness of our methods. The results show that the performance has been significantly improved.  相似文献   

14.
15.
通过献资料法阐述了运动对骨骼肌基因表达的影响,以便深入理解骨骼肌的工作原理,为客观指导运动训练提供依据.  相似文献   

16.
目的 :探讨端粒酶基因表达与癌细胞生物学行为及其端粒酶活性关系。方法 :用原位杂交的方法检测端粒酶基因 h TR和 h TRT在 1 1 5例癌组织 ,2 3例癌前病变 ,2 0例良性病变中的表达情况。结果 :1 1 5例癌中 h TR阳性率为 83.5 % ,h TRT阳性率为 80 .9% ;2 3例癌前病变中 h TR、h TRT阳性率分别为 39.1 %和 30 .4% ;2 0例良性病变中除 1例有 h TRT弱阳性外其余均为阴性。癌组织 h TR和 h TRT的表达与癌前病变、良性病变比较有显著性差异 ( p<0 .0 1 ) ,而癌组间无差异。h TR、h TRT表达在淋巴结转移癌组明显高于无转移组 ,端粒酶基因表达随肿瘤分化程度降低而有增高的趋势。结论 :端粒酶基因 h TR和 h TRT在多种癌及癌前病变组织中均为高表达且有很大相关性。端粒酶的激活发生在癌变早期 ,提示与癌的发生、发展密切相关。原位杂交技术检测h TR和 h TRT对恶性肿瘤诊断具有重要意义  相似文献   

17.
Extracellular xylanase XYNB from Streptomyces olivaeeoviridis A1 has been purified and characterized.The optimal pH value and temperature of XYNB for its activity are 5.2 and 60℃, respectively. The specific activity of XYNB is as high as 2869.78 U/mg. Metal cations, EDTA and SDS have no effects on enzyme activity of XYNB. The gene xynB coding mature protein of XYNB has been cloned by PCR. The forward oligonucleotide primer used in the PCR reaction was synthesized based on the N-terminal amino acid sequence of XYNB mature protein, and the reverse oligonucleotide primers are random oligonucleotide. The cloned gene xynB is 576 bp long and its G C content is 64.3%. The xynB encodes 191 amino acid residues, and the putative molecular weight of XYNB is 20.839 kD. The xynB has been expressed in E. coli, and the expressed xylanase has normal bioactivity.  相似文献   

18.
Progress in artificial control system for gene expression   总被引:2,自引:0,他引:2  
Along with the increasingly wide application of transgenic techniques, new stricter criteria have been raised for controlling the expression of exogenous genes. For these demands, a series of artificial control systems for gene expression have been developed and testified in recent years, which can control exogenous genes expression in exact time and certain level by administration of a specific drug or hormone. The successful construction of these systems offers a practicable method to control precise expression of exogenous gene in organisms, and raises the feasibility of wide application of gene therapy.  相似文献   

19.
针对基因表达谱的高维、小样本及高噪声等特点,提出一种选择性集成分类方法。首先,采样改进的分类信息指数法进行属性约简,剔除大量无效基因实现降维;然后,基于bootstrap技术的样本扰动和核模糊粗糙集的特征扰动构建多个样本子集,训练多个基分类器;最后,采用教与学优化算法构建选择性集成分类器。仿真实验结果表明,算法在分类精度、集成规模及稳定性等方面具有较强优势。  相似文献   

20.
A new method designated cDNA array was developed by hybridization of quantitatively arrayed DNA samples isolated randomly from a cDNA library with probes reverse-transcribed from mRNAs of different sources or treatments. The gene expression patterns of 1 000 randomly chosen clones from an Arabidopsis library were analyzed with green seedlings versus suspension cells and seedlings irradiated under UV light. Northern blot and sequence analysis of some differentially expressed clones confirmed the results revealed by cDNA array, indicating that this method is efficient and reliable to monitor gene expression.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号