首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于残差超网络的DNA微阵列数据分类   总被引:1,自引:1,他引:0  
DNA微阵列数据特征维度高,包含噪音,属性之间以及属性与样本类别之间有着复杂的关联性.然而传统超网络的超边一般是从训练集中随机选取属性而组成,难以保证超边质量,而且其分类性能受超边初始化过程影响很大,导致效果不稳定.针对传统超网络的这一局限,提出一种基于残差分析的超网络分类模型.残差算法根据显著性检验,首先假设属性相互独立,然后根据95%的置信水平,运用残差分析,用落入拒绝域的属性值对超网络的超边库进行初始化,以获取关联性较高的超边集合.然后采用梯度下降法进行超网络的演化学习.对急性白血病、前列腺癌和肺癌数据集的实验表明:与传统演化超网络分类器相比,该方法不仅有较高的分类精度,而且提高了分类的稳定性和收敛性.  相似文献   

2.
基于演化超网络的中文文本分类方法   总被引:2,自引:0,他引:2  
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以X2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.  相似文献   

3.
本文系统扼要介绍了DNA微阵列的技术方法和应用。包括DNA微阵列的制造原理、杂交和检测的方法,数据结果分析方法,DNA微阵列应用范围,优缺点和发展趋势。  相似文献   

4.
DNA 微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于粗糙集的支持向量机基因表达数据分类方法,该方法采用粗糙集进行基因特征约简,运用支持向量机进行数据分类,实验表明其分类效果良好.  相似文献   

5.
用于微阵列数据癌症分类的演化硬件多分类器   总被引:1,自引:0,他引:1  
针对单分类器识别率低、稳定性差的问题,提出了一种用于微阵列数据分类的演化硬件多分类器选择性集成方法.首先把经过预处理的原始训练集随机划分为训练集和验证集;然后通过对训练集的学习获得基于演化硬件的基分类器;再用验证集评价基分类器的性能,选择其中一部分较好的基分类器组成最终的分类系统;最后用独立的测试集验证系统的性能.试验结果表明,对急性白血病和结肠癌数据集的识别率分别为95.42%、88.33%,与其他的模式识别方法具有可比性;同时在识别率相当的情况下,该方法的硬件代价远低于全集成的演化硬件多分类器.  相似文献   

6.
为解决传统模式识别方法学习结果过于复杂且难以解读的问题,提出了一种基于遗传算法的演化学习超网络模型.与传统的基于梯度下降和超边替代的超网络学习算法不同,演化学习超网络模型在其学习过程中引入了遗传算法.将超网络的超边集合划分成多个子种群;对子种群中的个体进行选择、交叉和变异等遗传操作,并对每一代种群进行子种群间优秀个体的迁移.每个子种群并行执行演化操作,完成演化后得到一个具有决策能力的超网络分类器.利用演化超网络对急性白血病、肺癌和前列腺数据集进行分类试验.结果表明,演化学习超网络对3个数据集的分类准确率分别为96.21%,99.26%,96.09%.所提出的方法与其他传统的模式识别方法相比,具有更高的分类准确率,而且其学习结果具有很好的可读性,有利于挖掘与癌症诊断密切相关的基因对高阶关联关系.  相似文献   

7.
赵晚昭  谢聪 《广西科学》2022,29(2):260-268
针对现有基因微阵列数据分类中存在的数据维度高、容易发生过拟合的问题,提出了基于BTLBOGSA(Binary TLBOGSA)与卷积神经网络(Convolutional Neural Network, CNN)的基因微阵列数据分类模型(BTLBOGSA-CNN)。该模型首先针对基因微阵列数据分类时存在的数据维度高的问题,利用新的编码策略,将连续搜索空间转换为二元搜索空间,结合教与学优化(Teaching-Learning-Based Optimization, TLBO)算法的二元变体与引力搜索算法(Gravitational Search Algorithm, GSA)的各自特点,基于BTLBOGSA方法从基因微阵列数据集中选择具有高鉴别性的基因;然后针对基因微阵列数据分类易发生过拟合问题的现象,利用卷积神经网络进行基因微阵列数据的分类。利用公开的基因微阵列数据集进行仿真实验,从TLBO算法与GSA结合的有效性、BTLBOGSA与CNN结合的有效性、BTLBOGSA-CNN与其他已有分类模型相比的有效性3个方面进行对比分析,结果表明,BTLBOGSA-CNN模型可以在较少的特征基因下...  相似文献   

8.
结合最优类别信息离散的细粒度超网络微阵列数据分类   总被引:1,自引:0,他引:1  
针对传统演化超网络只能有效处理二值数据输入的问题,提出一种结合最优类别信息离散(Optimal Class-Dependent Discretization, OCDD)的细粒度演化超网络模型,对连续数据进行离散化生成细粒度二进制编码,并通过对其进行演化学习得到具备决策能力的超网络分类器.该方法避免了传统超网络模型对连续数据进行直接二值化后的高信息损失,使演化超网络的概率估计更接近于数据真实分布,提高了超网络的决策分类能力.对结肠癌、肺癌、前列腺癌和急性白血病4种DNA微阵列数据集进行实验的结果表明,结合OCDD的细粒度演化超网络具有比传统演化超网络更高的识别率和鲁棒性.  相似文献   

9.
从超循环理论的角度分析了供应链网络所具备的生命系统的三个基本特征——新陈代谢特性、自组织性和突变性;剖析了供应链网络循环的三个层次——反应循环、催化循环和超循环的形成机理;并运用超循环演化原理对供应链网络形成过程进行较为详细的仿生协同推演。研究表明:供应链网络应保持开放性,创建有效的信息管理机制并建立合理的选择机制。  相似文献   

10.
针对DNA微阵列的高维、小样本及高冗余等特点,提出了一种新的集成分类方法.基于bootstrap技术的样本扰动和kruskalwallis与邻域互信息的特征扰动训练多个具有较大差异性和较高准确性的基分类器;针对教与学优化算法易陷入局部最优、优化精度不高和收敛速度较慢等不足,从"教"与"自学"过程入手,设计了一种改进的教与学优化算法实现基分类器的选择性集成,并用于DNA微阵列分类.仿真实验结果表明:该方法在分类精度、集成规模、稳定性等方面具有较强的优势.  相似文献   

11.
利用衍生DNA研制定量检测基因芯片   总被引:1,自引:0,他引:1  
 为了建立基因芯片定量检测技术体系,在同一张芯片上完成不同浓度DNA的梯度测定,本研究以检测探针序列为基础,合成不同的衍生DNA作为标准曲线测定的探针序列.由于衍生序列与检测探针序列之间不改变碱基配对关系,同时具有相同的PCR扩增序列,使得标准品的浓度与测定值之间具有较好的相关性,从而解决了基因芯片定量测定中的标准曲线制作问题.结果显示,用衍生DNA序列作为标准DNA,其基因芯片测定值与浓度之间的相关性系数达到0.995以上,用此方法建立定量基因芯片测定的浓度与实际浓度一致.本研究为研制定量检测基因芯片提出了新的思路.  相似文献   

12.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

13.
针对目前大规模基因数据集中存在大量的噪声和冗余基因这一问题,提出了一种基于置换检验的两步基因特征选择算法。该算法首先采用方差分析过滤噪声基因,然后采用相关系数过滤冗余基因,最后结合置换检验的方法,可以高效、自主地处理大规模基因数据集。采用PAM(prediction analysis for microarrays)分类器,在RSCTC 2010 Discovery Challenge提供的12个竞赛数据集作基因特征选择与分类实验,实验结果表明,提出的算法能够选择高分辨、低冗余的基因子集,与目前其他基因特征选择算法相比,可以提高分类器性能。  相似文献   

14.
Optimization for the technological processes of fabricating oligonucleotide microarray by the molecular stamping method is studied in this note. Three factors that affect the pressing coupling reactions of the nucleosides are focused on: the stability of the chemical activities of the reaction solutions, the contamination of the remain of the reactive nucleotides among the different spots on the chip, and the influence of the capping reaction on the hybridization result. The experiments show that the acetonitrile solution of tetrazole and nucleoside monomer could maintain sufficient reactive activity for more than 10 h. An effective method has been used and proved to eliminate the residual reactive nucleosides on chip with small molecules containing hydroxyl group. Finally, the capping step-- a regular step in the conventional DNA chemical synthesis can be neglected in our on-chip DNA synthetic process, which would not affect its hybridization results.  相似文献   

15.
在Markowitz的均值-方差模型的基础上,讨论了股票价格中偏度的重要性,并由此引出了一个同时考虑均值、方差和偏度的多目标投资组合选择模型。提出了对该模型进行求解的进化规划算法,同时也说明了用进化规划方法处理多目标优化问题的合理性。用一个算例验证了采用进化规划技术求解多目标投资组合选择模型是有效的。  相似文献   

16.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

17.
将进化规划算法应用于图像聚类问题,对问题的解进行符号编码,采用群体智能模式实现问题解的搜索.利用进化规划算法的变异算子和选择算子可以有效提高算法的全局搜索能力,采用高斯变异算子保证了优秀解的多样性,降低了进化操作的复杂性.仿真实验证明基于进化规划算法的图像聚类算法具有可行性和准确性.  相似文献   

18.
为了完整的区分地形数据库中各种地理要素的变化类型,提出了地形数据变化分类所依据的4因子模型,即对象整体、对象组件、对象或对象组件的状态、属性值的逻辑运算结果,这4个因子具有一定的层次结构。变化类型首先根据高层次的因子判断,如果高层次因子无法区分变化,则逐渐降低确定变化的因子类型。基于提出的方法,建立了一个自动化提取和发布变化信息的信息系统。实验结果表明,该模型能满足空间数据生产者发布变化信息的需要。  相似文献   

19.
目的提出高光谱数据的分类流程,以取高光谱数据对地物具有更高的光谱分辨率的优势,避其巨大数据量和波段间强相关性的弱势。方法应用辨别分析和决策面特征提取方法。结果减低了数据量,优化了高光谱信息。特征提取对高光谱信息优化处理十分有效,并达到了高维信息数据降维和高效利用的可行性。结论在一定的分类精度范围内,减低维数而不丢失信息,可以提高分类器的效能,实现高维遥感数据的优化处理和高效利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号