首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 936 毫秒
1.
针对DNA微阵列的高维、小样本及高冗余等特点,提出了一种新的集成分类方法.基于bootstrap技术的样本扰动和kruskalwallis与邻域互信息的特征扰动训练多个具有较大差异性和较高准确性的基分类器;针对教与学优化算法易陷入局部最优、优化精度不高和收敛速度较慢等不足,从"教"与"自学"过程入手,设计了一种改进的教与学优化算法实现基分类器的选择性集成,并用于DNA微阵列分类.仿真实验结果表明:该方法在分类精度、集成规模、稳定性等方面具有较强的优势.  相似文献   

2.
综合考虑对海雷达目标识别的高实时性和强泛化能力要求,提出一种利用模拟退火算法(SA)进行集成间隔优化的静态选择集成(SSE)算法.该算法首先利用SA基于集成间隔最大化搜索出不同大小的最优基分类器子集,然后利用集成分类精确度从中筛选出最终的集成分类器系统.进而提出一种分类器权值、样本权值的迭代求解算法,并考虑这两类权值以及基分类器的分类置信度,给出了8种集成间隔定义.在自建全极化高分辨率距离像(HRRP)分类数据集和17个UCI数据集上分析了集成间隔定义对集成算法性能的影响,通过对比实验验证了该算法的有效性.  相似文献   

3.
针对基因表达谱的高维、小样本及高噪声等特点,提出一种选择性集成分类方法。首先,采样改进的分类信息指数法进行属性约简,剔除大量无效基因实现降维;然后,基于bootstrap技术的样本扰动和核模糊粗糙集的特征扰动构建多个样本子集,训练多个基分类器;最后,采用教与学优化算法构建选择性集成分类器。仿真实验结果表明,算法在分类精度、集成规模及稳定性等方面具有较强优势。  相似文献   

4.
基于选择性的贝叶斯分类器集成方法   总被引:2,自引:0,他引:2  
提出一种基于选择性的贝叶斯分类器集成方法.该方法为避免数据预处理时的属性约简对分类效果的直接影响,在训练集上通过随机属性选取生成若干属性子集,并以这些子集训练不同的贝叶斯分类器,进而采用遗传算法优选贝叶斯分类器集成,其适应度函数综合了分类器的精度和差异度两项指标.实验中,将该方法与已有方法在UCI的标准数据集上进行了性能比较,并将该方法用于C^3I系统中的威胁度估计。  相似文献   

5.
用户属性在个性化服务中具有重要的作用,利用手机数据进行用户属性预测逐渐成为新方向.利用手机应用类别均使用时长和应用类别个数,提出了基本属性与辅助属性的概念.首先对所有未标注样本的辅助属性离散化,将辅助属性基于类别的海灵格距离作为基本属性的特征权重,将基本属性与权重的乘积作为特征训练集成分类器中的各个基分类器,并引入随机森林中的带外样本准确率作为基分类器的权重,得到最终的分类结果.实验结果表明,本文所给出的集成分类器框架能够提高用户属性预测的效果.  相似文献   

6.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

7.
基于代表的邻域覆盖粗糙集分类算法,在某些数据集上表现良好,数据的类别不平衡问题严重影响算法的分类精度.为尽量消除类别不平衡问题的影响,在k折交叉验证方法的基础上,针对基于代表的邻域覆盖粗糙集分类算法,提出了3种集成策略.策略1依靠k折交叉验证,获得对应的k个基分类器,所有的基分类器组成委员会对未分类样本分类;在策略1的基础上,策略2选择分类精度相对较高的基分类器组成委员会,对未分类的样本进行分类;策略3在前2种策略的基础上,利用主动学习的思想,对训练集进行扩充,得到新的分类器再对未分类样本分类.实验所用数据集为UCI标准数据集,且对k的取值做了对比实验.结果显示,3种策略均有不同程度的提升,且k取5时总能取得较好的提升效果.对于不同数据集,应选择相适应的改进策略.  相似文献   

8.
为进一步提升图分类算法的性能和稳健性,提出了差分进化算法优化的图注意力网络集成.首先,通过划分原始样本让不同的基学习器关注数据的不同区域;其次,利用差分进化算法良好的搜索能力,以分类器集成的分类错误率为目标函数优化基学习器的权重向量;最后,在权重向量基础上综合各基学习器的输出作为分类器集成的总体输出.实验引入引文数据集...  相似文献   

9.
集成分类器是目前图像隐写分析中广泛使用的分类器。针对集成分类器中基分类器受离群样本影响较大,集成策略效果不佳的缺点,提出一种基于改进Fisher准则与极限学习机集成的图像隐写分析算法。首先,通过重新定义类内散度矩阵以提高Fisher准则模型的准确性,之后基于改进的Fisher准则并使用Bagging算法训练若干基分类器,最后使用极限学习机作为元分类器来建立基分类器集合与正确决策之间的联系。实验结果表明,在不同的隐写算法与嵌入率的条件下,与传统集成分类器和基于选择性集成的集成分类器相比,所提算法降低了3.5%与1.8%的检测错误率,说明能够有效提高集成分类器的检测精度。  相似文献   

10.
融合样本选择与特征选择的AdaBoost支持向量机集成算法   总被引:2,自引:0,他引:2  
为提高AdaBoost分类器集成算法的分类精确度并简化分类系统的复杂度,提出一种融合样本选择与特征选择的AdaBoost支持向量机集成算法(IFSelect-SVME)。该算法在AdaBoost算法的每个循环中利用加权免疫克隆样本选择算法进行样本选择,并用互信息顺序向前特征选择算法进行特征选择,再利用每个循环优化选择得到的特征样本子集训练个体SVM分类器,并对其进行加权集成,生成最终的决策系统。对实验所用9组UCI数据集的仿真结果表明:与支持向量机集成(SVME)算法相比,IFSelect-SVME算法的正确分类率有所提高,且样本数可减少30.8%~80.0%,特征数可减少32.2%~81.5%,简化了集成结构,缩短了测试样本的分类时间,所得到的分类系统具有更好的分类精度。  相似文献   

11.
现有大多数多标记流特征选择算法在进行特征选择时,往往忽略标记间的相关性,易导致算法预测精度的下降。为解决这一问题,提出一种结合邻域信息和标记相关性的在线多标记流特征选择算法;定义自适应邻域关系解决邻域粗糙集的粒度选择问题,将其推广到多标记学习中;利用互信息计算标记间的相关性得到标记权重;通过邻域粗糙集和标记权重评估特征和标记间的相关性,并设计特征在线重要度分析、在线相关性分析和在线冗余度分析3种指标,以实现在线评价动态候选特征。在7组多标记数据集以及5个评价指标上的实验结果表明,所提算法综合性能较优。  相似文献   

12.
目的研究第三类覆盖粗糙模糊集的不确定性度量方法。方法通过引入上下近似的标准差作为权重的度量标准,定义了一种新的覆盖粗糙模糊集的加权平均模糊度。结果该模糊度符合模糊度的定义,能够衡量覆盖粗糙模糊集的不确定性程度。结论改进了罗世尧关于覆盖粗糙模糊集模糊度的计算方法,使之更为实用和有效。  相似文献   

13.
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题。针对LDA主题模型提取主题特征时存在冗余的不足,提出一种基于邻域粗糙集的LDA主题模型约简算法NRS-LDA。利用邻域粗糙集构造主题决策系统,通过预先设定主题个数,计算出每个主题的重要度;根据重要度进行排序,将排序后重要度低的主题删除。将提出的NRS-LDA算法应用于K-means文本聚类问题上并与传统的文本特征提取算法及改进的算法进行比较,结果表明NRS-LDA方法可以得到更高的聚类精度。  相似文献   

14.
In order to avoid the discretization in the classical rough set theory, a generlization rough set theory is proposed. At first, the degree of general importance of an attribute and attribute subsets are presented. Then, depending on the degree of general importance of attribute, the space distance can be measured with weighted method. At last, a generalization rough set theory based on the general near neighborhood relation is proposed. The proposed theory partitions the universe into the tolerant modules, and forms lower approximation and upper approximation of the set under general near neighborhood relationship, which avoids the discretization in Pawlak's rough set theory.  相似文献   

15.
滚动轴承故障诊断的案例推理方法   总被引:1,自引:1,他引:1  
针对滚动轴承的故障诊断问题,提出了一种采用案例推理(CBR)的诊断方法.为了解决检索相似案例时案例属性多、人工确定关键属性及其权重困难的问题,提出了一种Filter/Wrapper复合型特征选择算法,用邻域粗糙集算法粗选属性,用遗传算法进一步精选属性和优化权重,并有效地解决了邻域粗糙集算法中需要人工确定邻域大小的问题.以滚动轴承运行时的振动信号为基本信息,建立了滚动轴承案例库,从案例库中检索与问题案例相似的历史案例,并根据这些历史案例来判定问题案例的故障类别.试验结果表明,故障诊断的正确率达到100%,故障位置诊断的正确率达到93.3%,且算法具有较好的稳定性.  相似文献   

16.
扩展的粗糙集模型及其不确定性量度   总被引:5,自引:0,他引:5  
为克服标准的粗糙集模型不能表示数据对象的不同重要性和属性的不同特性的局限 ,需对其进行扩展。在可变精度粗糙集的基础上 ,构造了一种新的扩展粗糙集模型。它通过在知识表示系统和决策表中引入数据对象的权值函数和属性的特性函数来克服上述局限。给出了适于数据对象具有不同重要性情况下的粗糙决策规则集合的不确定性量度 ,以其作为规则评价的标准 ,可以方便地融入主观偏好、先验知识等因素。通过对一个数据集的分析实例对此进行了说明  相似文献   

17.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

18.
应用粒计算的混合智能故障诊断技术研究   总被引:1,自引:1,他引:1  
针对现有的混合智能故障诊断模型缺乏通用方法和混合框架,未能实现不同智能诊断方法的实质性融合和优势互补的问题,提出并构建了一种基于粒计算的混合智能故障诊断模型.该模型的核心是在邻域粗糙集中求取不同的邻域值,对故障特征集进行分层粒化,在不同粒度下获得核属性集.利用核属性集在相应粒度下构建人工神经网络和支持向量机子分类器,通过评估矩阵算法对所有粒度下全部子分类器的诊断结果进行融合集成.模型应用结果表明,分类精度随着粒度层的增加而不断提高,集成后的分类精度高于不同粒度下的所有子分类器,从而体现了粒化分层的优势和不同智能诊断方法的优势互补,为混合智能诊断提供了一种新途径.  相似文献   

19.
广义单向S-粗集和它的一般结构   总被引:2,自引:1,他引:2  
基于单向S-粗集和一般二元关系R,本文给出广义单向S-粗集,对广义单向S-粗集的一般结构进行了描述,对广义单向S-粗集的有关性质进行了讨论.广义单向S-粗集为研究一般系统动态的近似特性提供了新的途径和方法.  相似文献   

20.
实时预测民航发动机滑油量对保障飞行安全具有重要意义.针对滑油量受发动机多个工作状态的多个参数影响,具有影响参数多,提取方法不确定等问题,提出了一种基于邻域粗糙集(neighborhood rough set,NRS)和灰狼优化(grey wolf op-timizer,GWO)-Elman相结合的方法预测滑油量.首先通过邻域粗糙集提取对滑油量重要度高的发动机工作阶段,将提取后的工作阶段有关参数作为特征向量输入到灰狼优化-Elman的网络模型中,灰狼算法通过计算和比较个体的适应度来优化El-man网络中的权值和阈值,保证Elman网络中的权值和阈值达到全局最优.预测结果表明,精度达到98.44%,满足工程应用的精度要求.研究结果为及时监测民航发动机滑油系统的健康状况提供理论依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号