首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
属性约简是粗糙集理论的核心内容之一,在信息系统的对象信息不断出现增删等更新操作的环境下,如何进行快速有效的属性约简则是一个亟需解决的迫切问题.提出一种面向增删操作的属性约简更新算法,面向更新前后的决策表,首先分析了对象信息动态增加与删除情况下信息熵的变化机制以及约简属性对新增或删除对象的区分情况,然后提出基于区分情况的新条件熵值的计算方法,最后给出基于散列表的属性约简更新算法.实验结果证明,本文方法可以快速求解出增删更新后的属性约简结果,其性能较传统方法有较大优势.  相似文献   

2.
一种快速的动态属性约简矩阵算法   总被引:1,自引:0,他引:1  
针对实际决策表中对象动态变化的情况,首先引入简化决策表概念,剔除决策表中大量重复的对象,并构造了基于正区域的简化矩阵,有效地缩小了算法的搜索空间;然后从理论上阐述了基于简化矩阵的属性约简和基于矩阵的属性约筒的一致性,并仅需扫描一遍简化矩阵便可求解出属性约简;最后在原属性约简的基础上,提出一种快速的动态属性约简矩阵算法.通过算例分析和实验对比验证了算法的有效性和可行性.  相似文献   

3.
SLOF算法采用了空间对象的空间属性和空间关系确定空间邻域,并结合非空间属性的权值来计算对象在其邻域内的离群度,但在计算属性权值时,仍然由邻域专家决定,存在人为因素.文中采用计算每个对象的每个非空间属性的去一划分信息熵增量,并通过这个值来反映各个属性对对象离群的贡献程度,给出一种改进的SLOF算法.实验结果表明,算法具有计算效率高和对用户依赖性小的优点.  相似文献   

4.
针对实际决策表中对象动态变化的情况,首先引入简化决策表概念,剔除决策表中大量重复的对象,并构造了基于正区域的简化矩阵,有效地缩小了算法的搜索空间;然后从理论上阐述了基于简化矩阵的属性约简和基于矩阵的属性约简的一致性,并仅需扫描一遍简化矩阵便可求解出属性约简;最后在原属性约简的基础上,提出一种快速的动态属性约简矩阵算法.通过算例分析和实验对比验证了算法的有效性和可行性.  相似文献   

5.
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.  相似文献   

6.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

7.
用属性单值表示的决策表简化算法及属性核计算   总被引:1,自引:0,他引:1  
为了降低决策表的存储空间,提高计算属性核的效率,提出了一种用属性单值表示的决策表简化算法.给出了条件属性的尺度、权值、属性单值和简化决策表的定义,以及尺度运算、权值运算、每个对象的条件属性值集合转换为一个属性单值的简化运算的严密公式,并通过决策表的可逆定理证明了简化决策表与原始决策表具有相同的信息表达能力.利用该算法简化决策表,条件属性的表达由多维降低为一维,从而有效地降低了决策表的存储空间.实验结果表明,简化决策表属性核的计算效率明显比现有决策表属性核的计算效率高,尤其是对于大型决策表,这种优势更加明显.  相似文献   

8.
一种新的模糊C均值聚类算法   总被引:1,自引:1,他引:0  
传统的模糊C均值聚类算法及其变型在聚类过程中都假设所有的属性对聚类贡献相同,所以很难发现隐藏在部分属性中的类结构,也难以识别出重要属性.在实际应用中,噪声属性较为常见,并且会影响正常的聚类过程.鉴于以上原因,提出了一种新的基于属性加权的模糊C均值聚类算法,通过对人工数据和实际数据的聚类测试结果,证实了该算法的有效性.  相似文献   

9.
有效对象的判定理论与方法   总被引:1,自引:1,他引:0  
基于属性层次结构,定义了有效/无效对象,研究了判定有效/无效对象的相关理论与方法,给出生成所有有效/无效对象的缩减法,并就具有10个属性的属性层次结构,对其算法进行了线性回归.  相似文献   

10.
影响基于差别矩阵的属性约简算法效率的主要因素有计算U/C等价类和差别矩阵的大小.为了解决差别矩阵大小影响属性约简算法计算效率,分析了基于差别矩阵的属性约简算法中差别矩阵定义的不足,重新定义了一种压缩差别矩阵,删除差别矩阵中大量的空元素和相同元素,从而进一步减少了差别矩阵元素的个数,并设计基于压缩差别矩阵的属性约简算法.对UCI及其他数据库进行仿真,实验结果表明该算法具有高效性.  相似文献   

11.
为准确高效的完成数据的准备工作,提出在属性集不同、对象集相同形式背景下多区间概念格的动态横向合并算法.首先,为保证格结构的完整性,对区间概念格的渐进式生成算法进行改进,将区间概念分为存在概念、冗余概念和空概念;其次,结合区间概念格自身特点,给出区间概念格一致性的概念以及格结构横向合并的充要条件;再次,将合并后的区间概念分情况进行讨论,并给出相应的横向合并原理;最后应用层序遍历的方法扫描格结构,提出横向合并效率.实例表明,该算法的可行性和高效性.  相似文献   

12.
朴素贝叶斯在处理分类问题上简单高效,通常它假设属性间是条件独立的,且各属性变量对类变量的影响程度是相同的,但在实际应用中这些都难以被满足,从而使得其分类性能降低.因此,提出基于属性约简的加权朴素贝叶斯分类算法,该算法首先根据各属性不同取值的分类能力及属性间的对称不确定性大小,去除了无关属性和冗余属性,使得筛选后的属性之间具有较低的关联度和较强的分类能力;然后再结合属性与类变量及属性间的相关性对各属性进行加权;最后对待判样本进行分类.经实验结果表明,该算法有效地提升了朴素贝叶斯的分类性能.  相似文献   

13.
针对现有不完备决策表属性约简算法复杂度较高的问题,提出了基于属性分辨度的属性约简算法.文中分析了不完备决策表中条件属性相对于决策重要性的外在表现,提出了属性分辨度的概念,并给出了属性分辨度随着约简属性集的变化而动态更新的计算方法.该算法在属性约简过程中会不断删除已经属于正域的对象或不影响正域计算的相容块,通过降低样本数据的规模来减少计算耗时,加速属性约简.理论分析和仿真实验表明,文中算法是有效的,并且算法复杂度优于现有的不完备决策表属性约简算法.  相似文献   

14.
一种用于数据挖掘算法的数据生成方法   总被引:1,自引:0,他引:1  
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.  相似文献   

15.
基于邻域粗糙集的属性约简模型既受邻域半径参数值的影响,又不能评估属性与样本对象之间的内在关系.为此,本文先提出鲁棒近邻来确认对象的邻域,计算出若干个与样本对象最近同类与最近异类对象距离的平均值,然后依据分类区分函数的定义来确定近邻类的邻域半径大小,构造了鲁棒近邻粗糙集模型.最后按照其模型,基于样本对象对属性的评价准则提出了鲁棒近邻的属性约简算法.该算法模型分别在CART,KNN和LSVM三个分类器和10个样本数据集中测试运行,实验效果表明该模型不但可以筛选得到较少的属性集,而且还可以有效提高分类精度.  相似文献   

16.
 空间分类是空间数据挖掘的重要分支,寻找高效的空间分类算法是空间分类研究的重要方向.在空间对象的邻接图及朴素贝叶斯分类法的基础上提出一个新的空间分类算法,该算法对空间对象进行分类时,既考虑了待分类对象的属性对分类的影响,又考虑了其空间邻接对象对它分类的影响.该算法的计算复杂度不高,分类的正确性好.  相似文献   

17.
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。  相似文献   

18.
一种快速属性约简算法   总被引:6,自引:1,他引:5  
基于差别矩阵的属性约简算法,先要求出差别矩阵,随着问题的规模增大,存放差别矩阵的空间和算法的执行时间过大和过长,让计算机难以承受.针对这一问题,提出了差别对象对集的定义,给出了基于差别对象对的属性约简定义,并证明了该定义等价于基于差别矩阵的属性约简定义.利用差别对象对,设计了一个新的属性约简算法.由于这一算法在求属性约简的过程中不用生成差别矩阵和大量的无用元素,因而大大减少了存储量和计算量,从而提高了算法的效率.计算实例说明了新算法的高效性.  相似文献   

19.
持续CORBA对象是指其属性等状态信息能够持续保持的分布式对象.采用何种策略来管理持续CORBA对象,对于基于CORBA的系统的响应时间和运行效率都具有重要的影响.叙述了持续对象的实现方法,详细给出了基于优先级和LRU算法的持续CORBA对象管理策略,在此基础上,提出了利用信号量来解决对象互斥调用的控制方法.算法复杂性的分析结果表明,当对象索引表中的对象按对象ID的顺序排列时,其时间复杂度为O(logn2),其他情况为O(n).所提出的持续CORBA对象管理策略已被应用于实际的系统中.  相似文献   

20.
对传统ID3算法的信息熵作近似变换达到简化计算的目的,并针对ID3算法倾向于选择取值较多的属性和排斥属性值分布均匀的属性两个缺点,引入贡献因子来改进ID3算法,使属性选择方法平衡的选择划分属性.实验表明,优化后的属性选择方法降低了分类时间,优化了分类结果并能很好地反映实际情况.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号