首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 23 毫秒
1.
区间集粗糙集是针对目标集不能被精确表达时利用上下界进行近似刻画的有效方法,而对于连续型数据,基于等价关系的区间集粗糙集不再适用,相容关系则常被用于处理连续型数据。为进一步提高近似精度,文章将基于相容关系的极大相容块与区间集粗糙集结合,提出连续型数据集上基于极大相容块的区间集粗糙集。首先在信息系统中提出基于距离的相容关系及其极大相容块,由此定义基于极大相容块的乐观、悲观粗糙集,并讨论它们的性质。进而将极大相容块引入区间集粗糙集,提出了基于极大相容块的乐观、悲观区间集粗糙集,讨论了它们的性质及关系以及两类区间集粗糙集的精度。最后选取UCI数据集上的五组数据,验证了本文所提极大相容块下的模型较之相容关系下对应模型的精度平均提高33%。  相似文献   

2.
δ-邻域计算是邻域粗糙集模型中操作最为频繁和复杂的。针对邻域计算,提出了利用多阈值替代单一阈值,并根据样本空间的分布,提出块集概念,证明了每个样本的邻域只存在于与之相邻的块集中。在此基础上,提出基于块集的多阈值邻域粗糙集的属性约简算法,降低了计算邻域的时间复杂性,并利用多个UCI标准数据集对该算法进行验证,结果表明,该算法行之有效。  相似文献   

3.
数据特征空间的高维性使得学习过程耗费了相对较多的时间,而且可能影响分类性能.邻域粗糙集模型可以用来解决特征选择问题,但该模型未能描述现实存在的样本的模糊性,可能导致信息的丢失.因此,建立了一种新的单标记特征选择模型,采用两种不同的隶属度计算方法获得样本对等价类的模糊隶属度,将每个等价类中最小隶属度值作为隶属度阈值.然后利用邻域样本隶属度与阈值的关系重新定义邻域粗糙上、下近似,进而通过衡量决策属性对特征子集依赖度的大小进行特征选择.在七个公开的UCI数据集上进行了实验,实验结果表明,与已有的几种特征选择方法相对比,分类准确度得到了进一步提高,选择的特征数目明显减少.  相似文献   

4.
基于邻域粗糙集的属性约简模型既受邻域半径参数值的影响,又不能评估属性与样本对象之间的内在关系.为此,本文先提出鲁棒近邻来确认对象的邻域,计算出若干个与样本对象最近同类与最近异类对象距离的平均值,然后依据分类区分函数的定义来确定近邻类的邻域半径大小,构造了鲁棒近邻粗糙集模型.最后按照其模型,基于样本对象对属性的评价准则提出了鲁棒近邻的属性约简算法.该算法模型分别在CART,KNN和LSVM三个分类器和10个样本数据集中测试运行,实验效果表明该模型不但可以筛选得到较少的属性集,而且还可以有效提高分类精度.  相似文献   

5.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

6.
针对不完备决策系统的规则提取问题,提出一种基于极大团的不完备系统规则获取方法.引入图中极大团概念定义相容块构造范式,将其等价转换为极小析取范式后得到不完备系统全体极大相容块,收集每一相容块最全描述即可生成极大相容块最全描述系统,进而为最全描述系统中的每一对象构造决策分辨范式得到与该对象对应的全体可信关联规则.该方法具有2个特点:针对系统中每一基本信息粒自动生成基准置信参数,避免了预设固定参数而遗漏置信度小于此参数的部分有用规则;将决策分辨范式等价变换为其极小析取范式,避免了采用特定顺序选择属性而遗漏部分有用规则.将该算法应用于某保险公司私家车客户车险数据和UCI不完备数据集,实验结果与数据分析说明了该算法的分类预测性能.  相似文献   

7.
集值信息系统基于极大变精度相容类的属性约简   总被引:1,自引:0,他引:1  
集值信息系统中对象的属性集值一般不唯一,基于集值信息系统上的变精度相容关系,给出了极大变精度相容类及其对应的粗糙集模型的定义,并以极大变精度相容类为基础,讨论了集值信息系统的属性约简及其相应的区分函数计算方法.  相似文献   

8.
在区间值信息系统中定义了一种新的变精度相容关系,研究了这种相容关系诱导的极大变精度相容类;提出了基于极大变精度相容类的区间值模糊目标信息系统的粗糙集模型;进一步讨论了利用粗糙隶属函数获得决策规则的方法,最后通过实例说明了方法的可行性.  相似文献   

9.
邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据。因为引入了邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对负域中的样本进行邻域划分操作,算法计算量很大。为此提出了一种基于Relief算法属性重要度的快速属性约简算法,降低计算邻域的算法时间复杂性。通过和现有算法运用多组UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

10.
利用邻域粗糙集处理数值型数据,可以解决经典粗糙集不能直接处理数值型数据的问题,改进后的变精度邻域粗糙集可以增强抗噪声的能力。但变精度邻域粗糙集的属性约简有不同于邻域粗糙集的特性,需要考虑每个决策类的下近似分布。文中提出可以遵循平均错误率来约简属性,减少计算规模。实验证明,使用UCI数据集与其它算法进行了比较,该算法可以获得理想的结果。  相似文献   

11.
一种不完备信息表的预处理方法   总被引:1,自引:0,他引:1  
针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究. 应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化. 数值示例和实验结果显示此方法是有效可行的.  相似文献   

12.
信息系统中粒计算模型及其属性约简方法   总被引:1,自引:0,他引:1  
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法,目前在国际上逐步得到了人工智能有关研究人员的重视。模糊粒度模型、粗糙集粒度模型、邻域系统下的粒计算模型、商空间模型、相容粒度空间模型是目前几种常用的粒计算模型。基于粗糙集理论的粒度模型,通过决策信息系统的粒子空间中各粒子的推理,给出了决策信息系统中核属性计算方法;在此基础上,提出了决策信息系统属性约简的计算方法;通过实例验证了该方法的有效性。  相似文献   

13.
基于邻域决策错误率的属性约简可以在删除冗余属性的同时,提升邻域分类器的留一验证分类精度.但这种约简方式并未充分考虑邻域分类结果在约简前后的差异.为解决这一问题,借助联合分布矩阵,提出了邻域决策一致性的概念,构建了邻域决策一致性与邻域分类精度的调和平均值,并将其作为约简求解的度量准则.在12个UCI数据集上的实验结果表明,所提出的新约简不仅能够有效地提升邻域分类器的决策一致性,而且在多数情况下能够进一步提高邻域分类器的留一验证分类精度.  相似文献   

14.
为了从不完备多属性决策系统中获取概率决策规则,提出了一种不完全信息下概率决策的扩展粗糙集方法. 给出了容差关系下相容度的概念,通过设定相容阈值给出知识的粗糙下近似、上近似和边界域,然后讨论了粗糙近似的基本性质和概率决策规则的获取.通过实例说明这个新方法的可行性和有效性.  相似文献   

15.
不确定性度量在属性约简中具有重要作用.通过逐步构建3种改进的单调不确定性度量,为属性约简提供重要依据.首先,通过2个阈值,构建邻域概率粗糙集模型,并提出3种具有非单调性的邻域概率不确定性度量;为此,将邻域概率粗糙集与邻域粗糙集结合,改进性地提出了具有单调性的3种改进的邻域概率不确定性度量;最后,通过UCI数据实验对以上...  相似文献   

16.
信息粒度和近似方法是粗糙集理论进行数据描述的两个关键.现实中数据分布情况复杂多变,现有的模型缺乏对不同数据区域进行区分的能力,且易受到异常数据的干扰,导致最终分类决策的失误.为此提出基于合理粒度的局部邻域决策粗糙集模型.首先,根据邻域中对象的个数和类别识别一些极端情况(例如离群点和标签噪声点),分别给出不同分布情况下数...  相似文献   

17.
属性约简是数据挖掘、机器学习等研究领域中的一个颇为重要的预处理步骤,其效率的高低会直接影响相关任务的性能.针对已有的非增量式属性约简方法在相容块粗糙集模型中对象集发生变化时无法高效更新属性约简的问题,提出一种以区分度为启发信息的增量式属性约简方法 .首先,引入相容块的概念并运用相容块对论域进行划分,在此基础上给出不完备信息系统的区分度定义;然后,详细分析对象集发生变化条件下区分度的更新机理;进一步,以区分度为启发式信息构造增量式属性约简算法;最后,选取六个UCI数据集进行增量式约简的更新实验.实验结果表明,在不影响属性约简精度的前提下,该增量式方法的时间消耗比非增量式更新方法平均缩短50%,更加可行和高效.  相似文献   

18.
在邻域粗糙集的研究中,往往借助给定的半径来约束样本之间的相似性进而实现邻域信息粒化,需要注意的是,若给定的半径较大,则不同类别的样本将落入同一邻域中,易引起邻域中信息的不精确或不一致.为改善这一问题,已有学者给出了伪标记邻域的策略,然而无论是传统邻域还是伪标记邻域,都仅仅使用样本间的距离来度量样本之间的相似性,忽略了邻域信息粒内部不同样本所对应的邻域之间的结构关系.鉴于此,通过引入邻域距离度量,提出一种共现邻域的信息粒化机制,并构造了新型的共现邻域以及伪标记共现邻域粗糙集模型,在此基础上使用前向贪心搜索策略实现了所构造的两种模型下的约简求解.实验结果表明,与传统邻域关系以及伪标记邻域关系所求得的约简相比,利用共现邻域方法求得的约简能够在不降低分类器准确率的前提下产生更高的约简率.  相似文献   

19.
以某高校校园网络系统作为评估样本,在建立了信息系统安全属性模型的基础上,提出了基于变一致性优势关系粗糙集(VC-DRSA)的多属性群决策的安全评估方法.该方法将VC-DRSA与层次分析法(AHP)相结合,利用VC-DRSA分类质量的概念挖掘出隐含在数据背后的内在规律,在确定安全属性权重的基础上,对信息系统进行了综合安全评估.实例计算证明,该方法可以有效地解决多属性群决策的"瓶颈"问题,在信息系统安全评估中具有实际意义.  相似文献   

20.
针对启发式特征选择和特征聚类驱动特征选择方法的不足,研究了决策依赖的特征冗余性问题,提出了一种基于邻域粗糙集的决策依赖特征聚类的高维数据特征选择方法(RDCFS).首先,依据邻域粗糙集模型,设计了一种特征联合依赖度增益度量,刻画数据特征在分类和辨识层面上的冗余性和关联性.其次,构建了一种最优特征簇结构的评估准则和特征冗...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号