首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
对于数值型数据而言,邻域粗糙集模型是处理不确定信息的有效工具.现有的邻域粗糙集模型仅关注那些邻域中所有样本都属于同一个决策类的一致性情形,无法利用邻域中与多个决策类相交的边界样本所蕴含的信息.针对邻域粗糙集的这一局限性,将相容关系的极大相容块与邻域粗糙集相结合,选取样本邻域内的最大等价块作为最小的信息粒,通过重新定义邻域粗糙集的上下近似和属性重要度等概念,建立了一种基于极大相容块的邻域粗糙集模型.该模型可在更小的信息粒度下将原来边界样本转化成一致性样本来增大正域.运用前向贪婪策略构建了相应的属性约简算法.在七个公开的UCI数据集上的对比实验验证了提出模型的有效性.  相似文献   

2.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

3.
传统邻域粗糙集需指定半径或通过搜索方式找出适用于问题求解的半径,这在数据预处理过程中会带来极大的时间消耗.而粒球粗糙集方法则能够依据数据分布,自适应地生成合适的粒结构.以粒球的纯度为度量准则,粒球粗糙集方法亦为属性约简问题的研究引入新的思路.利用前向贪心搜索求解约简时,需尝试计算每一个候选属性被加入约简池后所引起的粒球...  相似文献   

4.
基于邻域粗糙集的属性约简模型既受邻域半径参数值的影响,又不能评估属性与样本对象之间的内在关系.为此,本文先提出鲁棒近邻来确认对象的邻域,计算出若干个与样本对象最近同类与最近异类对象距离的平均值,然后依据分类区分函数的定义来确定近邻类的邻域半径大小,构造了鲁棒近邻粗糙集模型.最后按照其模型,基于样本对象对属性的评价准则提出了鲁棒近邻的属性约简算法.该算法模型分别在CART,KNN和LSVM三个分类器和10个样本数据集中测试运行,实验效果表明该模型不但可以筛选得到较少的属性集,而且还可以有效提高分类精度.  相似文献   

5.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

6.
不确定性度量在属性约简中具有重要作用.通过逐步构建3种改进的单调不确定性度量,为属性约简提供重要依据.首先,通过2个阈值,构建邻域概率粗糙集模型,并提出3种具有非单调性的邻域概率不确定性度量;为此,将邻域概率粗糙集与邻域粗糙集结合,改进性地提出了具有单调性的3种改进的邻域概率不确定性度量;最后,通过UCI数据实验对以上...  相似文献   

7.
邻域粗糙集和模糊粗糙集是粗糙集理论中处理数值型数据的两种重要模型.在数值型信息系统中融合两者在不确定性度量方面的优越性,首先引入了模糊邻域粗糙集模型,并在该模型上定义了模糊邻域粗糙度的概念.模糊邻域粗糙度是通过粗糙集的边界域来度量信息系统的不确定性,为了达到更为全面的度量效果,在模糊邻域粗糙集模型中定义了模糊邻域粒结构,并基于该粒结构提出了模糊邻域粒度的概念,模糊邻域粒度是对信息系统分类能力的一种度量.最后,通过将两种度量方法进行结合,提出了一种基于模糊邻域粗糙集的混合不确定性度量方法,并从理论上证明其有效性.实验结果表明,所提出的混合度量方法综合了两种单独度量方法的优点,在数值型信息系统中具有更好的度量效果,因此所提出的不确定性度量方法更具有一定的优越性.  相似文献   

8.
区间集决策信息表拓展了经典决策信息表,其粒化结构的不确定性刻画成为重要应用基础。基于区间邻域粒化引入相对知识粒度,进而提出区间集决策信息表的一种新型不确定性度量。利用两对象之间的距离及半径来建立区间邻域粒化系统,证明距离粒化与相似度刻画的条件等价性,获得区间近似粗糙度;把经典相对知识粒度推广为区间相对知识粒度,将其与区间近似粗糙度进行信息融合,提出一种新型不确定性度量并得到了粒化单调性等性质。最后进行了实例验证,结果表明所提度量能够有效表征粒化结构变化所引起的不确定性变化。  相似文献   

9.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

10.
 在邻域风险最小化原则中提出一种新的定义邻域半径的方法,即对任意训练样本点,首先利用最佳距离度量近邻法定义一个距离度量,并根据这个距离度量来寻找该样本点的最近邻,然后依据它们之间的距离来定义邻域半径,最后在原有邻域风险最小化算法的基础上建立基于最佳距离度量近邻法的邻域风险最小化算法.实例表明新提出的算法是正确的、有效的.  相似文献   

11.
约简是粗糙集理论的核心研究内容,也是粗糙集区分于其他数据挖掘算法最精彩的部分.现有约简以信息表中满足某种性质的最小属性子集为主要特征,不考虑属性集之间的相互作用和相互补充关系.从一对满足某种性质的互补属性子集出发,寻找其最小互补属性子集对,从而保障所求约简属性集对满足一定的互补性,可对实际应用中的限制条件约简进行建模.其次,从约简需保持的性质与特定划分不确定度量之间的关系出发,提出几类基本的约简补集对的一般化定义.此外,结合经典启发式约简算法,提出约简补集对的通用求解算法.最后运用一个中西医结合诊断肺炎的约简补集对求解实例说明所提算法的实用性及有效性.  相似文献   

12.
以不完备信息决策系统为研究对象,提出了基于确定优势关系的粗糙集模型.在确定优势关系粗糙集的基础上,提出了相对下、上近似约简的概念,给出了求得相对下、上近似约简的具体方法,并在此基础上提取不完备信息系统中的确定优势粗糙决策规则.应用实例表明了所提出的新方法的有效性.  相似文献   

13.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

14.
属性约简是粗糙集理论研究的核心内容。目前已有的研究成果往往是根据分类性能、代价或不确定性等一些度量来定义及求解约简,并未充分考虑数据扰动有可能对约简结果产生的波动影响。为解决这一问题,提出了一种可以求解稳定约简的启发式算法框架:首先,在全体样本集上利用多次聚类进行多重采样以得到若干边界样本集合;其次,利用集成策略,对每一个属性在所有边界样本集合上求得的重要度进行融合;最后,选择重要度较高的属性加入到约简集合中。在8个UCI数据集上将新算法与传统算法进行对比分析,实验结果表明当数据发生扰动时,所提出的方法不仅能够有效地提升求解约简的时间效率与约简结果的稳定性,而且依据约简所求得分类结果的稳定性也有显著增强。  相似文献   

15.
姚红  蒋洁芳  袁滔  郝宇  朱蓥  杨健  王鹏飞 《科技资讯》2023,(14):208-212
描述部分已知概念的区间集粗糙集是对经典粗糙集的拓展,其属性值概念由上下边界集来描述,具有较好的不确定性刻画能力,能够有效促进数据挖掘、信息度量和知识发现等实际应用。现有研究主要针对离散型数据对象,不能很好地处理现实世界中大量存在的连续型数据对象,因此区间集粗糙集具有改进的空间。该文引入邻域关系,通过Hausdorff距离函数定义区间集邻域粒子,由此构造邻域区间集粗糙集模型,并从代数观点研究其相关概念及性质,最后用实例分析验证其有效性。  相似文献   

16.
邻域系统是一种数值信息粒度计算模型,该模型可以直接分析数值型数据,拓展了经典粗糙集理论的应用范围。邻域系统中现有的增量算法基本上都是从代数观下分析其变化情况。文章从信息观角度出发,分析了当批量增加样本后,新条件熵的变化机制,并分析出决定条件熵变化的是新增批量样本的不一致邻域,进而导致约简集的变化。基于此,提出一种信息观下批增量式属性约简算法,该算法只需找到新增的不一致邻域,并与新增样本一起进行约简,避免了有重复的约简,大大地减少了计算量,从而能够迅速得到更新后的约简集。最后分析了算法的复杂度,并且通过相关的实验验证了本文算法的有效性和高效性。  相似文献   

17.
邻域粗糙集是经典粗糙集的一个扩展模型,研究其不确定性度量模型具有重要意义。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量知识空间的粒度大小或边界域尺寸。在邻域系统中,对于目标概念为模糊时的情形,其不确定性不仅来自于邻域粒的边界域,还来自于正域和负域,当前的不确定性度量方法较少考虑这种情形。为此,构建了邻域粗糙模糊集模型,从粒计算的角度出发,进一步提出了多粒度邻域粗糙模糊集模型;针对多粒度邻域粗糙模糊集具有乐观性与悲观性的特点,借鉴Vague集中支持度和反对度的思想,设计了基于模糊度的多粒度模糊熵的不确定性度量方法,不仅符合人类的认知习惯,而且可以有效刻画整个邻域知识空间的结构信息。  相似文献   

18.
变精度粗糙集下基于信息熵的属性约简算法   总被引:5,自引:0,他引:5  
本文针对在Z.Pawlak粗糙集下进行属性约简中存在的问题,在对变精度粗糙集理论下卢下近似约简概念分析的基础上,引入了信息熵,建立了变精度粗糙集意义下的决策表中属性重要性的度量方式,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,从而刻画了标准粗糙集下正域之外的不一致信息的不确定程度,以该度量作为启发式信息,提出了基于信息熵的β下近似约简的启发式算法.这为不一致信息系统的属性约简提供了理论依据与算法.  相似文献   

19.
在对网络安全发起攻击的恶意DoH流量数据中,存在属性特征影响恶意DoH流量攻击目标达成,使用基于邻域粗糙集的极限学习机决策分析方法建立恶意DoH流量预警模型,可为恶意DoH流量预警提供决策支持。首先运用邻域粗糙集属性约简算法对高维DoH流量特征进行降维,并得到约简后的属性重要度,然后利用极限学习机算法测试评估约简后的属性特征对数据样本的分类正确率。应用实例表明,在保证样本类别比例与原数据集一致的前提下,约简后的属性特征对样本数据具有足够高的分类准确率,验证了文中所提基于邻域粗糙集的极限学习机决策分析方法能有效地简化恶意DoH流量安全评价的复杂度。  相似文献   

20.
变精度邻域粗糙集相比于邻域粗糙集具有抗噪容错的能力,但由于重新定义了下近似,正域的划分不再严格,使得属性重要度的可信度降低,在精度改变的情况下无法优先选取最优的属性.针对这一问题,分析变精度邻域粗糙集的下近似,引入邻域内的正确分类率,定义属性质量度,提出一种基于正域的增量和平均正确分类率的增率相结合的属性度量方法.通过和现有的基于属性重要度的属性约简算法做比较,实验结果表明,改进后的属性度量方法对变精度有更好的适应性,在不同变精度阈值下能得到更优的约简结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号