首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
信息系统中,属性约简是知识发现问题的一个研究热点,能达到发掘并简化知识的目的。目前已有很多利用辨识矩阵来进行属性约简的研究,但是当数据维数较大时,算法复杂度往往很大。利用加权欧几里得距离来定义二元关系及辨识矩阵,利用信息系统的约简与生成图的最小顶点覆盖等价的关系,将辨识矩阵求解约简的问题转化为求解生成图中最小顶点覆盖的问题,并给出了Pythagorean模糊信息系统中属性约简的算法;在此基础上,利用基于加权欧几里得距离的相似关系,定义了Pythagorean模糊决策信息系统的辨识矩阵,并给出了用最小顶点覆盖的方法求约简算法,最后利用实例验证了算法的有效性。  相似文献   

2.
一种基于相对粒度的不完备决策表约简算法   总被引:1,自引:0,他引:1  
为有效地从不完备决策表中获取最小相对约简,提出了一种基于相对粒度的不完备决策表约简算法.该算法通过分析研究知识的相对粒度在属性约简过程中的变化趋势,并基于属性约简定理,尝试通过不断向核属性集中增加属性的方法,从不完备决策表中获取最小相对约简.最后通过实例验证了该算法的有效性.  相似文献   

3.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

4.
文中提出一种离散和连续混合属性的复杂信息系统增量式属性约简算法.首先,将粒计算模型中的知识粒度在混合型信息系统下进行推广,提出了邻域知识粒度,并构造出基于邻域知识粒度的非增量式属性约简算法,然后在混合型信息系统下研究了邻域知识粒度随对象增加时的增量式计算,理论证明了该计算方式的高效性,最后提出了基于邻域知识粒度的混合信息系统增量式属性约简算法.UCI数据集的实验结果表明,所提出的算法在混合型信息系统中具有很高的增量式属性约简性能.  相似文献   

5.
介绍模糊粗糙集约简算法,利用模糊区分矩阵产生最小约简.通过分析,说明了算法的不足,提出相应的改进策略.将启发性知识结合区分矩阵,提出了基于属性特征权值的启发式约简算法,文中算法意义更加直观,计算也更加简单,提高了约简算法的速度.采用VC进行实验,通过对多个UCI数据集进行测试,结果说明了改进算法的有效性.  相似文献   

6.
考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.  相似文献   

7.
基于类别相关性和交叉熵的特征选择方法   总被引:1,自引:0,他引:1  
文本分类首先要解决的一个问题就是特征选择.简单分析了几种经典的特征选择方法,总结了它们的不足,提出了一个类别相关性方法,把交叉熵引入粗糙集并提出了一个基于交叉熵的属性约简算法,把该属性约简算法同类别相关性方法结合起来,提出了一个综合的特征选择方法.该方法首先利用类别相关性方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,此特征选择方法效果良好.  相似文献   

8.
为了提高无核或少核序决策信息系统中现有属性约简算法的执行效率,本文以知识粒度表征的属性重要度为启发信息并结合前向属性约简方法提出了一种新的属性约简算法。首先,介绍优势粗糙集方法的相关基础知识,并将经典粗糙集中基于知识粒度的属性约简算法引入优势粗糙集方法中,得到可处理序决策信息系统的属性约简算法;然后,通过分析序决策信息系统中知识粒在属性数目变化条件下的粗化与细化过程,得出相对冗余属性的判断定理,由此结合前向属性约简方法设计了快速属性约简算法;最后分析比较了2种算法的时间复杂度并选取了6个不同的UCI数据集进行算法性能的测试,测试结果表明,本文提出的算法比现有的属性约简算法高效。  相似文献   

9.
针对决策属性集合中只存在两个决策集合的情况,为简化决策属性的表达和计算复杂度,提高约简效率,提出一种改进粗糙集决策表的属性约简算法。该算法以条件属性对决策属性的支持度为基础,采用新的约简规则,基于可分辨矩阵的启发式算法,根据属性重要度改进属性约简算法。以高新技术企业智力资本测量指标体系为例,得到了高新技术企业智力资本的最小约简集。结果表明,该约简算法能够得到一个完备的最小约简集,并能显著提高求解约简集的效率。  相似文献   

10.
知识约简的差别矩阵启发式算法   总被引:9,自引:1,他引:9       下载免费PDF全文
首先从差别矩阵的角度 ,对决策表中属性的重要性给出度量 ,并提出了部分差别矩阵的概念 .在此基础上提出了一种基于部分差别矩阵的知识相对约简的启发式算法 ,并通过实例分析表明 ,在多数情况下该算法能够得到决策表的最小约简 .  相似文献   

11.
一种快速属性约简算法   总被引:6,自引:1,他引:5  
基于差别矩阵的属性约简算法,先要求出差别矩阵,随着问题的规模增大,存放差别矩阵的空间和算法的执行时间过大和过长,让计算机难以承受.针对这一问题,提出了差别对象对集的定义,给出了基于差别对象对的属性约简定义,并证明了该定义等价于基于差别矩阵的属性约简定义.利用差别对象对,设计了一个新的属性约简算法.由于这一算法在求属性约简的过程中不用生成差别矩阵和大量的无用元素,因而大大减少了存储量和计算量,从而提高了算法的效率.计算实例说明了新算法的高效性.  相似文献   

12.
基于互信息度量的特征约简是一种重要的Filter特征约简方法,其目的是剔除条件特征中与决策类别不相关的特征,并使约简子集中特征间的相关性最小.为此,本文基于特征间的区分性评价准则,提出了互信息下二进制区分矩阵的特征约简模型,并从理论上证明了二进制区分矩阵模型与互信息模型下特征约简的等价性;其次给出了条件特征的重要性度量准则,并利用渐进式计算方法构造了一种快速的特征约简算法;最后通过实验进一步验证了算法的可行性.  相似文献   

13.
模糊信息系统上的粗糙约简   总被引:3,自引:0,他引:3  
:基于粗糙集理论和模糊等价关系,提出了模糊信息系统(FISs)在不同粒度划分上的知识约简方法和属性重要性度量.这些约简利用了2个水平划分参数(或对象相似度)α、β,其中相对约简与属性重要性度量采用了决策类的水平集正区域公式.利用水平集粗糙成员函数得到分布约简与分配约简方法,它们扩展了Pawlak信息系统(PISs)上的属性约简方法,解决了FISs上的知识获取与特征选择问题.同时,基于不同粒度下的等价类,给出了FISs上可辨识属性矩阵、分布约简和分配约简的辨识公式,克服了经典方法在FISs上的不适用性.示例结果表明,在不同粒度空间上,这些约简方法产生了与全部属性具有最大程度分辨能力和规则置信度的属性子集.  相似文献   

14.
一种变粒度的规则提取算法   总被引:1,自引:0,他引:1  
属性约简和值约简是粗糙集理论中知识获取的重要组成部分。通常,在知识获取的过程中先进行属性约简,然后在其基础上进行规则提取。但在实际应用中,属性约简在简化信息系统与提高规则提取效率的同时,原始信息系统中有些重要的条件属性可能被丢弃,从而导致属性约简后对信息系统进行知识获取得到的规则其数量与简化程度并不占优。针对上述问题,提出一种基于粒度变化的规则获取算法,通过属性粒度从粗到细的变化,直接从原始信息系统中提取规则;采用该方法得到的规则与属性约简后得到的规则相比,它们的数量与平均每条规则包含的特征属性数相对较少。最后,在理论分析的基础上,通过实例验证了算法可行性,并通过实验验证了算法的正确性和高效性。  相似文献   

15.
针对商务决策支持系统中存在信息不确定、冗余数据量大的问题,提出了一种基于Rough Set理论的提取最小规则算法。该算法的核心是改进的分明矩阵属性约简和启发式的属性值约简。通过算法对原始数据表中的冗余属性和属性值进行约简,得到了决策表和最小决策规则。最后,对商务决策支持系统的实例进行数据约简,挖掘其中的隐含知识,获取了有价值的决策信息。  相似文献   

16.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

17.
知识约简是粗糙集理论研究中的一个重要内容,可辨识矩阵是属性约简的一个重要方法,把这种方法推广到不完备模糊决策信息中,定义了相似关系下的可辨识矩阵,提出了不完备模糊决策信息系统中相似关系的可辨识矩阵属性约简的算法,最后用实例验证了算法的可行性.  相似文献   

18.
为提高决策表中最小属性约简的效率、稳定性和鲁棒性,基于云模型在非规范知识定性、定量表示及其相互转换过程中的优良特征对量子进化算法进行算子设计,提出了一种基于量子云模型演化的最小属性约简增强算法(QCMEARE).该算法采用量子基因云对进化种群进行编码,基于约简属性熵权逆向云进行量子旋转门自适应调整,使其在定性知识指导下能够自适应控制属性约简空间搜索范围,并采用量子云变异和云纠缠操作算子较好地避免了在属性演化约简中易陷入局部最优和早熟收敛等问题,使算法快速搜索到全局最优属性约简集.仿真实验表明,提出的最小属性约简增强算法具有收敛速度快、约简精度高和稳定性强等优点.  相似文献   

19.
基于贝叶斯粗糙集的文本特征选择方法   总被引:3,自引:1,他引:2  
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的.  相似文献   

20.
在粗糙集领域,属性约简的首要任务是在保持原有数据相关特性的前提下,获取一个最小的属性子集。代价敏感学习的目标旨在最小化各类代价。而近似属性约简的意义在于让决策者能够权衡代价承受能力和知识发现的程度。本文在定性和定量的标准下提出了代价敏感近似属性约简的问题;定性标准指不可分辨能力,定量标准指近似参数ε和代价。基于三支决策和可分辨矩阵,提出了解决代价敏感近似属性约简问题的框架:首先,定义了属性子集的质量函数,该函数解释了多粒度结构;其次,通过考察属性重要度,提出了"性价比"指标的适应函数;进而利用提出的适应函数和三支决策中的(α,β)阈值对三分属性集合;最后,设计了删除策略和添加策略的代价敏感属性约简算法。从实验结果分析上验证了算法的有效性,体现了提出的问题和理论框架具有更广义的解释和适应性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号