首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的数据点作为聚类中心,将与该聚类中心相似度大于阈值卢的所有数据点聚集形成数字颗粒结构.在整个聚类过程中无需调整每个数据点的熵值,缩短了计算时间,同时利用粗糙集的不可分辨关系形成字符颗粒结构,通过不断调整、合并这两种颗粒结构,实现了具有混合属性特征数据的聚类分析.实验结果比较表明,该算法是有效、可行的,当卢取值为0.8时,算法的聚类有效性最大值可达0.96,该值较同条件下的其他聚类算法要高。  相似文献   

2.
信息系统的粒度熵及基于粒度熵的属性约简算法   总被引:2,自引:1,他引:1  
针对完备信息系统中,知识随着知识中属性的逐渐增加或减少从而对论域产生不同粗细的划分进行研究,给出了一个新的度量--粒度熵,以度量知识随着属性的逐渐增加或减少对论域产生不同粗细划分时的分辨能力,并基于粒度熵设计了对信息系统进行属性约简的算法.  相似文献   

3.
何圣姿  黎琼 《江西科学》2012,30(2):130-132
结合考虑二元关系产生的知识模块粒度大小及集合X边界的知识粒度对X的粗糙性的影响,利用知识的粗糙熵及粗集的边界熵给出度量粗集粗糙性的新方法—集合的粗糙熵。  相似文献   

4.
针对区间值犹豫模糊信息系统,提出了两种基于区间犹豫模糊多粒度粗糙集的三支决策模型。首先,借助多粒度粗糙集理论,提出乐观和悲观区间犹豫模糊多粒度粗糙集模型。其次,引入区间犹豫模糊连续交叉熵的概念,用TOPSIS方法来计算对象在不同情况下的条件概率。基于此,定义区间犹豫模糊决策理论粗糙集并给出相应的三支决策规则。最后,通过实例验证了这两种模型对目标评估采取不同的态度和决策方案,并且证明了所提算法的有效性。  相似文献   

5.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

6.
一般二元关系中基于边界域的知识粗糙熵与粗集粗糙熵   总被引:1,自引:0,他引:1  
不确定性度量是粗集理论研究的重要内容之一。基于信息论,结合Pawlak拓扑思想,提出了一般二元关系(自反性)下基于边界域的知识粗糙熵新定义,修正了粗集粗糙熵的定义。相对于传统粗糙熵,新的知识粗糙熵概念能更准确地度量知识和集合的不确定性,并在此基础上证明了新的知识粗糙熵和修正后的粗集粗糙熵都随知识分辨能力的增强而单调下降。  相似文献   

7.
边界条件熵的属性约简及在定性仿真中的应用   总被引:1,自引:0,他引:1  
从Pawlak拓扑的角度,给出了一种知识边界粗糙熵和边界条件熵的新定义,并反映出集合的不确定性可以通过边界域来描述的思想,证明了边界条件熵随着信息粒度的变小而单调减少的重要结论.弹簧定性仿真实例,结合定性推理技术,以边界条件熵为基础构造属性约简的启发式算法,消去定性描述中的冗余,获得了弹簧系统定性微分方程式.实验结果表明,粗集理论在定性推理与定性仿真技术中的重要应用价值,基于边界条件熵的属性约简是有效的.  相似文献   

8.
基于近似精度和条件信息熵的粗糙集不确定性度量方法   总被引:1,自引:0,他引:1  
基于粗糙集理论的基本不确定性度量方法能够度量知识的不确定大小,却不能区分集合粒度划分大小,利用知识的信息熵,并结合粗糙集精度,定义了一种粗糙熵,用于度量粗糙集中的不确定性.证明了该粗糙熵随着划分粒度的变小而单调增加的性质.新的粗糙熵不仅能度量粗糙集的不确定区域大小而且可以度量划分的大小.算例证明了该方法的有效性.  相似文献   

9.
数值离散化中粒度熵与分类精度的相关性   总被引:1,自引:0,他引:1  
研究离散化方案中断点数、粒度熵与分类精度之间的关系,证明了粒度熵随着断点数的增加而下降.设计了一种混合型的数值离散化算法来提供多种相容离散决策表.实验发现:粒度熵和分类精度之间的相关程度有时高于断点数和分类精度之间的相关程度.  相似文献   

10.
结合图的顶点覆盖理论,探讨了悲观多粒度粗糙集粒度约简的新方法.首先提出悲观多粒度粗糙集诱导图的概念,并给出其粒度约简的图特征,在此基础上,以图的方法刻画粒度的重要度,进而设计基于图的悲观多粒度粗糙集粒度约简的算法;其次,定义悲观多粒度决策粗糙集诱导图的概念,类似地给出其粒度约简的图特征和粒度重要度,设计基于图的悲观多粒...  相似文献   

11.
由于相似关系或相容关系不具有传递性或对称性,从而相容类或相似类之间存在误判,因此研究不完备信息系统中合适粒度下的粗糙性度量和属性约简算法很有必要。在不改变相关模型的基础上,文章通过极大相容块的思想,研究了非等价关系的基本知识粒度构造,进一步讨论了合适粒度下的粗糙性度量方法,提出了基于极大相容块的知识粗糙性更精确的定义和极大相容块的条件信息熵及其属性重要性定义,并证明了相关性质;给出了合适粒度下属性约简的启发式算法,结果表明,极大相容块的重要性度量避免了通常意义下粒度过粗问题,知识粗糙性更为准确。  相似文献   

12.
大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8.  相似文献   

13.
针对大数据环境下并行支持向量机(support vector machine,SVM)算法存在噪声数据较敏感、训练样本数据冗余等问题,提出基于粒度和信息熵的GIESVM-MR(the SVM algorithm by using granularity and information entropy based on MapReduce)算法.该算法首先提出噪声清除策略(noise cleaning,NC)对每个特征属性的重要程度进行评价,获得样本与类别之间的相关度,以达到识别和删除噪声数据的目的;其次提出基于粒度的数据压缩策略(data compression based on granulation,GDC),通过筛选信息粒的方式保留类边界样本删除非支持向量,得到规模较小的数据集,从而解决了大数据环境下训练样本数据冗余问题;最后结合Bagging的思想和MapReduce计算模型并行化训练SVM,生成最终的分类模型.实验表明,GIESVM-MR算法的分类效果更佳,且在大规模的数据集下算法的执行效率更高.  相似文献   

14.
为了体现事物之间的差异,对信息系统的对象给予一定的权重,给出了加权信息系统的概念,定义了加权信息系统中知识的划分粒度表示方法,讨论了划分粒度的性质,并证明了知识的代数表示和划分粒度表示的等价性.  相似文献   

15.
针对评估数据缺失的问题,提出了一种新的缺失数据填充方法.从信息熵的角度对评估系统进行描述,并提出一种建立在区间值信息系统上的加权广义信息熵,对这种信息熵的非负性、单调性和极值性进行证明.在此基础上,通过研究评估系统数据缺失前后信息熵的变化情况,建立一种基于加权广义信息熵的缺失数据填充方法,并从知识粒度的角度论述加权广义信息熵的机制.通过实例分析与现有的部分算法进行比较,进一步证明文中算法对评估系统缺失数据填充的有效性.  相似文献   

16.
关于粗糙集理论与信息熵的几点注记   总被引:7,自引:7,他引:0  
基于信息论中信息熵的概念及性质,在粗糙集的信息系统中添加一个概率测度后,对信息论和粗糙集理论中的一些概念进行了比较,给出了粗糙集理论中知识粗糙性、边界和知识约简在信息论中的解释,并将概率论、信息论和粗糙集的知识相结合,得到了一种规则提取的新方法。  相似文献   

17.
在粗糙集理论中,由于用模糊粗糙熵去度量RF集的不确定性更具有直观性,所以如何利用香农信息熵理论定义模糊粗糙集的熵的度量,是一个值得研究的问题.结合知识粗糙性和信息熵给出了模糊粗糙集的熵的度量新定义,并对其一些性质进行了讨论.  相似文献   

18.
一种基于粒度的规则挖掘方法   总被引:3,自引:0,他引:3  
利用知识的粒度,提出了一种新的规则挖掘方法.首先利用粗糙集中判断属性重要性的尺度,获取一个属性,由此属性形成对域的粒度,并对粒度中的每一个粒进行同样操作,直至所有粒的决策属性值唯一为止.算法分析与实验对比说明,该方法是有效可靠的.  相似文献   

19.
从粒度计算的观点出发,给出了信息系统中知识距离的定义,指出利用知识距离可以度量信息系统中知识的粗糙性,分析了其相关性质.提出了一种基于知识距离的启发式属性约简算法,算法不需求核,对无核的特殊信息系统计算约简更加有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号