首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

2.
在大数据时代,越来越容易收集到大量样本,目前使用多个二元关系且可对混合型样本分类的已有方法较耗时.为克服这个不足,本文提出了两类局部邻域多粒度粗糙集模型,并研究了一些相关性质.通过算法和实例说明了所提出的模型的有效性.  相似文献   

3.
多标记学习的嵌入式特征选择   总被引:2,自引:0,他引:2  
维数约减是数据挖掘领域的关键技术.传统的降维方法主要解决单标记学习问题.由于多标记学习问题的复杂性,多标记降维方法很少.直接应用未监督的降维方法到多标记学习中,忽略了类标信息.而通过分解多标记问题为单标记问题,应用现有的有监督降维方法到多标记学习中,忽略了类标间的关系.现有的多标记有监督的降维方法是基于依赖最大化的维数约简(multi-label dimensionalityreduction via depen dence maximization,MDDM),它是一种特征抽取的方法.目前还没有多标记的特征选择方法.因为在多标记学习中如何评估特征,是一个很有挑战性的问题.本文提出一个嵌入式的特征选择方法MEFS(multi-label embedded feature selection),其中采用预报风险准则作为特征的评价准则.在公开评测的yahoo网页分类数据集上进行了两个实验:(1)分析多标记学习的性能指标对特征评估的影响;(2)比较MEFS与MDDM,PCA(主成份分析),LPP(局部保留投影)的降维效果,实验显示MEFS的性能优于新近提出的MDDM等一些流行的多标记降维方法.  相似文献   

4.
对于数值型数据而言,邻域粗糙集模型是处理不确定信息的有效工具.现有的邻域粗糙集模型仅关注那些邻域中所有样本都属于同一个决策类的一致性情形,无法利用邻域中与多个决策类相交的边界样本所蕴含的信息.针对邻域粗糙集的这一局限性,将相容关系的极大相容块与邻域粗糙集相结合,选取样本邻域内的最大等价块作为最小的信息粒,通过重新定义邻域粗糙集的上下近似和属性重要度等概念,建立了一种基于极大相容块的邻域粗糙集模型.该模型可在更小的信息粒度下将原来边界样本转化成一致性样本来增大正域.运用前向贪婪策略构建了相应的属性约简算法.在七个公开的UCI数据集上的对比实验验证了提出模型的有效性.  相似文献   

5.
现有的多标记降维算法常通过学习标记相关性构建样本间的相似关系,进而提高学习系统的性能.然而,在实际应用中,样本的标记信息可能存在噪声,且部分标记信息可能缺失,因此由样本的标记信息学得的标记相关性可能不准确,无法有效挖掘样本间的相似关系.为了解决该问题,从样本的特征空间与标记空间两个方面构建样本间的相似关系.在利用标记空间学习标记相关性的同时,通过引入特征空间中的概率超图模型,提出一种嵌入样本流形结构与标记相关性的多标记降维算法.在十个多标记数据集和六种评价准则上的实验结果证明了所提算法的有效性.  相似文献   

6.
构造了融合粗糙集与球形支持向量机的多分类识别模型,提出了基于相对距离的球形支持向量机多分类识别算法。首先,通过粗糙集对样本集进行属性约简;然后,对约简后的样本集运用球形支持向量机进行训练,对于未知样本,按照未知样本到各类球心相对距离的大小进行分类,将未知样本归入相对距离较小的一类中去;最后,仿真结果证明:该方法可以有效地消除冗余属性,降低支持向量机的样本输入维数,提高了泛化能力。  相似文献   

7.
代价敏感学习是数据挖掘和机器学习领域的重要课题.已有的研究方法多数针对单目标进行优化,并不适用于多目标代价敏感问题的解决.因此通过分析基于粗糙集领域的单目标代价敏感属性约简问题,定义了多目标代价敏感属性约简问题,并设计了一种简单高效的算法.在4个UCI数据集上的实验结果表明,该算法能获得令人满意的帕累托最优解集,以辅助用户进行方案的选择.  相似文献   

8.
模糊C-means算法是一种重要的聚类分析算法,但是在数据维数较高的情况下,该算法计算量急剧上升从而导致其效率较低.针对这一问题,提出了一种基于粗糙集理论的模糊C-means高维数据聚类算法,该算法在传统模糊C-means算法的基础上引入了粗糙集属性约简的理念,通过对数据集属性的约简,提取出对分类影响较大的属性集而摒弃与分类无关的属性,进而在聚类过程中只计算属性约简结果集中的属性,从而减少聚类过程的工作量、提高聚类效率.理论分析和实验结果表明,该算法在处理高维数据时较高效.  相似文献   

9.
由于多标记学习中的"维度灾难"问题,鉴于判别嵌入式聚类(DEC)算法对数据降维的特点,本文提出了基于DEC算法的多标记学习。该算法在多标记数据集作分类处理之前,采取DEC算法对多标记数据集进行维度约简,从而降低算法复杂度、提高分类性能。实验结果表明,这种基于DEC算法的多标记学习是有效的。  相似文献   

10.
多标记特征选择已被广泛应用于医疗诊断、模式识别等领域,然而现实中的数据往往存在维数灾难以及标记大量缺失等问题,现有的弱多标记特征选择算法又普遍易受缺失标记和噪声的干扰,使算法模型难以准确地选择重要特征.针对上述问题,提出一种用于弱多标记数据集特征选择的弱监督对比学习方法,旨在缺失和含噪声标记数据集中选择优质特征,同时挖掘少量人工标注数据中潜在的类间对比模式.该方法包括三个步骤:首先,设计一种弱监督预训练策略,通过利用实例相似性以及稀疏学习方法获取每个类标记类属属性,用于恢复缺失标记;其次,引入对比学习策略来捕获少量有标记数据的对比模式来削弱噪声数据的影响;最后,选取10组多标记数据集以及四个评价指标进行实验.实验结果证明,与多个先进多标记特征选择算法相比,提出的方法分类性能更优.  相似文献   

11.
属性约简是粗糙集理论研究的一个基本问题,它是一种有效的数据约简方法。然而,目前很多的属性约简算法在面对高维数据集时仍然不够高效。文中利用图论的相关理论和方法,对基于区分矩阵的粗糙集属性约简方法给出了直观和等价的刻画。在此基础上提出了基于图论的粗糙集属性约简方法。实验结果表明,新的属性约简算法在面对较大规模的数据集,尤其是高维的数据集时,不仅能有效地降低数据的维数,同时运行速度快且能保持较高的分类精度。  相似文献   

12.
粗糙集理论是一种有监督学习模型,一般需要适量有标记的数据来训练分类器,但现实中的一些问题往往存在大量无标记的数据,若标记数据则代价过大。概念近似是粗糙集理论的一个关键所在,基于相似关系粗糙集的提出,扩大了粗糙集理论的应用范围。为了应对大数据标记特性有限和计算效率低的问题,本文介绍了一个相似关系下的局部粗糙集理论模型,提出了具有线性时间复杂度的概念近似模型,理论证明和实例分析验证了基于相似关系的局部粗糙集中概念近似模型的优越性。  相似文献   

13.
通过构造辨识矩阵进行属性约简是一种有效的降低数据维度的方法.然而,经典粗糙集构造的辨识矩阵的局限性在于并不适用于连续型数据,只适用于离散型数据.因此,本文研究在模糊粗糙集下的辨识矩阵属性约简模型,并讨论该模型的相关数学性质,提出相应的算法来对连续型数据进行属性约简.通过实例验证该方法是有效的.  相似文献   

14.
在混合属性和大规模数据集条件下,针对粗糙集理论所面临的计算复杂度高的问题,本文提出了从横向和纵向两个方向上对粗糙集论域空间进行双向降维的研究思路.针对工程实际中,论域纵向维度对计算复杂度的影响更为明显,本文提出了混合属性全距离(WDMA)纵向降维数学模型.该模型基于粗糙集理论的可分辨性原理,能有效降低论域的纵向维数,简化粗糙集理论中所涉及的属性约简和属性值约简计算,显著降低后续计算的复杂性.工程实例验证表明,该模型能有效提高后续决策的运算效率,改善粗糙集理论的计算性能.  相似文献   

15.
比较于经典粗糙集,决策粗糙集模型将代价问题考虑在内,为粗糙集的属性约简问题带来了新的挑战。尽管已有针对决策粗糙集的一些属性约简方法被提出,但这些约简标准都是基于所有决策类的,约束条件较为严格。为解决这一问题,从局部视角出发,针对单独的决策类提出了Local约简的思想。基于启发式算法求解约简的实验结果表明,相比于面向所有决策类的约简,Local约简可以获得更多的正域规则,同时也能够进一步降低约简中的属性数量。  相似文献   

16.
在对网络安全发起攻击的恶意DoH流量数据中,存在属性特征影响恶意DoH流量攻击目标达成,使用基于邻域粗糙集的极限学习机决策分析方法建立恶意DoH流量预警模型,可为恶意DoH流量预警提供决策支持。首先运用邻域粗糙集属性约简算法对高维DoH流量特征进行降维,并得到约简后的属性重要度,然后利用极限学习机算法测试评估约简后的属性特征对数据样本的分类正确率。应用实例表明,在保证样本类别比例与原数据集一致的前提下,约简后的属性特征对样本数据具有足够高的分类准确率,验证了文中所提基于邻域粗糙集的极限学习机决策分析方法能有效地简化恶意DoH流量安全评价的复杂度。  相似文献   

17.
将基于单隐层前馈神经网络(SLFN)提出的极速学习机(ELM)算法和邻域粗糙集理论进行结合,提出基于邻域粗糙集的极速学习机算法,采用邻域粗糙集对样本集进行属性约简,去掉冗余属性,利用ELM对约简后的数据集进行学习,并对数据样本进行预测。实验表明ELM算法相比具有更高的训练精度和测试精度。  相似文献   

18.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

19.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

20.
针对权重粗糙集模型不能有效处理非平衡混合数据的问题,对权重论域上的各种类型变量进行分析并建立统一的模糊等价关系,提出混合数据上的权重模糊粗糙集模型,并利用该模型构造出带权模糊等价空间上的混合属性约简算法.混合属性约简算法产生的模糊软划分可以克服权重论域上离散硬划分产生的信息损失.在非平衡混合数据集上进行的实验结果表明,与基于权重粗糙集的算法相比,基于权重模糊粗糙集模型的属性约简算法的平均分类精度提高了11.9%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号