首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
用于微阵列数据癌症分类的演化硬件多分类器   总被引:1,自引:0,他引:1  
针对单分类器识别率低、稳定性差的问题,提出了一种用于微阵列数据分类的演化硬件多分类器选择性集成方法.首先把经过预处理的原始训练集随机划分为训练集和验证集;然后通过对训练集的学习获得基于演化硬件的基分类器;再用验证集评价基分类器的性能,选择其中一部分较好的基分类器组成最终的分类系统;最后用独立的测试集验证系统的性能.试验结果表明,对急性白血病和结肠癌数据集的识别率分别为95.42%、88.33%,与其他的模式识别方法具有可比性;同时在识别率相当的情况下,该方法的硬件代价远低于全集成的演化硬件多分类器.  相似文献   

2.
结合最优类别信息离散的细粒度超网络微阵列数据分类   总被引:1,自引:0,他引:1  
针对传统演化超网络只能有效处理二值数据输入的问题,提出一种结合最优类别信息离散(Optimal Class-Dependent Discretization, OCDD)的细粒度演化超网络模型,对连续数据进行离散化生成细粒度二进制编码,并通过对其进行演化学习得到具备决策能力的超网络分类器.该方法避免了传统超网络模型对连续数据进行直接二值化后的高信息损失,使演化超网络的概率估计更接近于数据真实分布,提高了超网络的决策分类能力.对结肠癌、肺癌、前列腺癌和急性白血病4种DNA微阵列数据集进行实验的结果表明,结合OCDD的细粒度演化超网络具有比传统演化超网络更高的识别率和鲁棒性.  相似文献   

3.
用于癌症分子分型的虚拟可重构结构演化硬件   总被引:1,自引:0,他引:1  
根据DNA微阵列数据维数高、样本少的特点,提出了一种用于癌症分子分型的演化硬件方法.该方法是基于虚拟可重构结构的演化硬件识别方法,具备灵活、高速和自适应能力强的特点,有利于建立一个拥有高数据吞吐能力、学习结果易读的高效分类系统.采用信噪比的方法进行特征选择,对选择的基因经过归一化和二值化,然后用演化硬件识别系统通过系统学习和系统分类2个阶段进行处理.急性白血病分类的硬件实验结果表明:演化硬件的识别率和识别时间分别达到了95.88%和0.12μs.  相似文献   

4.
针对Ada Boost算法训练分类器的特征具有大量冗余问题,提出了一种融合特征选择的Ada Boost集成算法.首先,使用一种特征选取方法,选择图像特征之间冗余度最小的特征,构造最优训练集;其次,采用Ada Boost算法训练分类器,构建分类模型;最后,使用分类模型实现待标注图像的自动标注.实验使用华盛顿大学用于图像自动标注的数据集,结果验证算法的有效性,并且相比其他传统算法,该算法具有更高的分类精度.  相似文献   

5.
疲劳驾驶是引起众多交通事故的重要因素之一,脑电作为一种直接反映大脑组织电活动的信号日趋成为评估驾驶疲劳检测与预警的研究焦点。提出了一种基于Ada Boost的组合型实验方法用于分析脑电检测疲劳驾驶。实验过程中针对不同受试者采用独立成分分析(independent component correlation algorithm,ICA)处理分析;继而进行样本熵、信息熵、模糊熵和AR系数的特征提取;最后运用Ada Boost将最小二乘向量机基于三种核分类器集成为一个强分类器。实验结果显示,采用Ada Boost分类器分类效果优于单个核分类器,对疲劳驾驶平均识别率达到93%,五折交叉验证准确率为91. 04%,在一定程度上推动了基于脑电信号的安全驾驶辅助监控系统的研究。  相似文献   

6.
为能够更好地从高特征维度的DNA微阵列数据中挖掘癌症相关基因,实现对恶性肿瘤的分子分型,提出了一种基于演化超网络模型的DNA微阵列数据分类方法?演化超网络是受生物网络启发而建立的一种认知学习模型,其学习过程非常适用于发掘基因间的相互作用?该方法采用信噪比进行基因选择,选择后的基因经归一化后用于演化超网络的学习和分类?通过急性白血病和结肠癌2种数据集进行实验,结果表明,演化超网络在分类精度方面与当前其他方法有较高的可比性?  相似文献   

7.
针对DNA微阵列的高维、小样本及高冗余等特点,提出了一种新的集成分类方法.基于bootstrap技术的样本扰动和kruskalwallis与邻域互信息的特征扰动训练多个具有较大差异性和较高准确性的基分类器;针对教与学优化算法易陷入局部最优、优化精度不高和收敛速度较慢等不足,从"教"与"自学"过程入手,设计了一种改进的教与学优化算法实现基分类器的选择性集成,并用于DNA微阵列分类.仿真实验结果表明:该方法在分类精度、集成规模、稳定性等方面具有较强的优势.  相似文献   

8.
针对两种类别的肿瘤分类问题,首先运用信噪比方法筛选出表达水平发生显著性变化的特征基因,然后采用支持向量机作为分类器进行肿瘤分类,通过对两种类别的白血病DNA微阵列数据进行计算,达到了97.1%的分类准确度.  相似文献   

9.
基于残差超网络的DNA微阵列数据分类   总被引:1,自引:1,他引:0  
DNA微阵列数据特征维度高,包含噪音,属性之间以及属性与样本类别之间有着复杂的关联性.然而传统超网络的超边一般是从训练集中随机选取属性而组成,难以保证超边质量,而且其分类性能受超边初始化过程影响很大,导致效果不稳定.针对传统超网络的这一局限,提出一种基于残差分析的超网络分类模型.残差算法根据显著性检验,首先假设属性相互独立,然后根据95%的置信水平,运用残差分析,用落入拒绝域的属性值对超网络的超边库进行初始化,以获取关联性较高的超边集合.然后采用梯度下降法进行超网络的演化学习.对急性白血病、前列腺癌和肺癌数据集的实验表明:与传统演化超网络分类器相比,该方法不仅有较高的分类精度,而且提高了分类的稳定性和收敛性.  相似文献   

10.
提出一种基于聚类的启发式选择性集成学习算法.集成学习通过组合多个弱分类器获得比单一分类器更好的学习效果,把多个弱分类器提升为一个强分类器.理论上来说弱分类器的个数越多,组合的模型效果越好,但是随着弱分类器的增多,模型的训练时间和复杂度也随之递增.通过聚类的方法去除相似的弱分类器,一方面有效降低模型的复杂度,另一方面选出差异性较大的弱分类器作为候选集合.之后采用启发式的选择性集成算法,对弱分类器进行有效的组合,从而提升模型的分类性能.同时采用并行的集成策略,提高集成学习选取最优分类器子集效率,可以有效地减少模型的训练时间.实验结果表明,该算法较传统方法在多项指标上都有着一定的提升.  相似文献   

11.
针对医学图像具有很高的特征维度和非常大的交叉性及相似性、极其容易造成类别归属混乱、导致医学图像多类别分类精度普遍较低的问题,首先提出了一种惯性权重自适应的粒子群算法,并以此为基础引入交叉算子提出一种混合优化算法.然后,采用中值滤波法、直方图均衡化方法对医学图像进行去噪、图像增强等预处理.最后运用改进后的混合粒子群算法集成SVM、KNN、Ada Boost分类器对医学图像进行特征分类研究.试验表明,本文算法的分类结果无论是直接特征提取,还是SIFT特征提取,相对于传统的分类器多类别分类准确率都有所提升;针对MIAS数据集,多类别分类相比于现有的分类算法有明显的精度提升.  相似文献   

12.
为解决传统分类算法的预测结果所提供的信息不够丰富的问题,采用理论分析和实验相结合的方法,融合Ada Boost算法和可拓学理论,提出一种全新的以关联函数的形式对分类结果进行表达的可拓Ada Boost算法.以Ada Boost算法为框架,结合可拓理论中可拓模型和关联函数的理论,寻找物元的本质特征元并以此作为弱分类器,提出了根据事物隶属所有类别的关联度来判断事物类别的方法.实验表明,可拓Ada Boost算法不仅用关联函数优化了传统分类算法预测结果为关于某一类别"是"或"不是"的简单表述,而且在适用问题中可以使分类结果更准确.  相似文献   

13.
为解决传统模式识别方法学习结果过于复杂且难以解读的问题,提出了一种基于遗传算法的演化学习超网络模型.与传统的基于梯度下降和超边替代的超网络学习算法不同,演化学习超网络模型在其学习过程中引入了遗传算法.将超网络的超边集合划分成多个子种群;对子种群中的个体进行选择、交叉和变异等遗传操作,并对每一代种群进行子种群间优秀个体的迁移.每个子种群并行执行演化操作,完成演化后得到一个具有决策能力的超网络分类器.利用演化超网络对急性白血病、肺癌和前列腺数据集进行分类试验.结果表明,演化学习超网络对3个数据集的分类准确率分别为96.21%,99.26%,96.09%.所提出的方法与其他传统的模式识别方法相比,具有更高的分类准确率,而且其学习结果具有很好的可读性,有利于挖掘与癌症诊断密切相关的基因对高阶关联关系.  相似文献   

14.
针对传统基于HOG特征与Ada Boost算法分类器在目标检测中存在检测速度慢、误差率大的问题,提出了一种基于自编码神经网络与Ada Boost的快速行人检测算法.该算法首先利用基于ACF模型的目标检测算法对图像进行预处理,获得疑似目标区域;然后对获取的子区域进行尺度归一化,提取HOG特征,并输入到自编码神经网络中进行降维;最后利用Ada Boost分类器对分类检测,输出检测到的行人区域.实验结果表明:文中所提算法的行人检测性能超过现有的检测算法,其检测速度也超过大多数算法.  相似文献   

15.
提出了随机平衡数据采样算法,以此为基础对Ada Boost算法进行修改并构建了随机平衡集成分类算法,采用6组UCI数据集对随机平衡集成分类算法进行实验,并与SMOTEBoost算法、RUSBoost算法、AdaBoost算法进行比较.实验结果表明,随机平衡数据集成算法具有更好的分类性能,在处理不平衡数据集方面有一定的优势,具有较强的多元性和鲁棒性.  相似文献   

16.
为了克服单一分类器的性能限制,通过集成不同分类器获得更高的雷达目标分类性能。在利用训练样本获得不同目标特征以及不同分类器的分类性能的基础上,根据注水原理计算出多个分类器集成的融合系数矩阵。对输出的判决系数矩阵设置判决阈值。实测雷达数据的实验结果表明,该文方法的平均识别率达到了87.68%。  相似文献   

17.
针对垃圾短信过滤问题,提出了一种亚文档集成学习方法.该方法采用亚文档集成学习框架将短文本在线二值分类问题转化成若干个子分类问题,并通过线性组合多个子问题的分类结果得出最终的分类预测.利用基于串频索引的文本分类算法实现了一种有效的弱分类器.实验数据表明亚文档集成学习框架能够提高现有文本分类算法的效能,而在亚文档集成学习框架下,基于串频索引的弱分类器过滤效果最佳.  相似文献   

18.
现有带钢表面缺陷在线识别系统中单个分类器对部分缺陷识别率不高,并且对训练样本依赖性较大;针对这一问题,提出了一种基于并行多分类器集成技术的带钢缺陷图像识别方法.该方法选择LVQ神经网络、RBF神经网络和支持向量机作为基分类器,应用加权投票法对基分类器进行集成,从而实现基分类器能力互补.实验表明,采用多分类器集成的带钢表面缺陷图像识别方法可以更准确地对带钢常出现的边缘锯齿、焊缝、夹杂、抬头纹等缺陷进行识别,能够得到相当或优于任何单个分类器的分类精度,总体识别率达到96%以上.  相似文献   

19.
增量学习是处理数据流的有效方式。文中针对已有增量分类算法只是作用于小规模数据集或者在集中式环境下进行的不足,提出了一种基于Hadoop云计算平台的增量分类模型,以解决大规模数据集的增量分类。该增量分类模型主要基于选择性集成学习思想,设计相应Map函数对不同时刻的增量样本块进行学习,以及设计Re-duce函数对不同时刻的分类器进行选择性集成以实现云计算平台上的增量学习。仿真实验表明该方法具有更好的性能,且能较好地解决数据流中的概念漂移问题。  相似文献   

20.
基于分布不完整数据选择性分类器   总被引:1,自引:1,他引:0  
通过删除数据集中的无关属性和冗余属性构建的选择性分类器可以有效地提高分类精度和效率.由于处理不完整数据的复杂性,已有的选择性分类器大都是针对完整数据的.然而,现实中的数据通常是不完整的并且包含许多冗余属性或无关属性.为解决这一问题,在构建的不完整数据分类器DBNB的基础上给出了一种有效的选择性分类器:SDBNB.在12个标准的不完整数据集上的实验结果显示,SDBNB的分类准确率比分类效果较好的选择性不完整数据分类器SNB和SRBC平均高出0.69%和0.58%,而其标准离差比SNB和SRBC平均低0.11和0.05.这表明SDBNB不仅有较高的分类准确率,而且分类效果更稳定.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号