首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

2.
基于属性约简的PLS加权朴素贝叶斯分类   总被引:1,自引:0,他引:1  
朴素贝叶斯算法是一种简单而高效的分类算法,它的属性独立性假设,影响了它的分类性能.针对这种问题,在分析属性相关性的基础上,通过属性约简选择一组近似独立的属性约简子集,提出一种基于属性约简的偏最小二乘回归加权朴素贝叶斯分类算法.对不同的条件属性给予不同的权值,从而在保持简单性的基础上有效地提高了朴素贝叶斯分类算法的分类性能.实验结果表明,该方法可行且有效.  相似文献   

3.
一种改进的Rough集属性约简启发式遗传算法   总被引:4,自引:0,他引:4  
属性约简是知识发现中的关键问题之一 .为了能够有效地获取决策表中属性最小相对约简 ,提出了一种在优化初始群体基础上提高算法性能的启发式遗传算法 .首先 ,通过构造一个新的算子 ,将信息论角度定义的属性重要性度量作为启发式信息 ,来描述所选择的属性子集对论域中确定分类子集的影响 ;接着 ,以此为基础并结合遗传算法 ,选择一些经过优化的染色体作为初始群体 ,在加强局部搜索能力的同时保持了该算法全局寻优的特性 .最后 ,从理论上对算法做了分析 ,证明了新算子所选择的属性子集对原有属性分类能力保持不变 .试验分析表明 ,该算法能有效地对决策表属性进行约简  相似文献   

4.
粗集中属性约简的一种启发式遗传算法   总被引:24,自引:1,他引:24  
为了获得决策系统中属性最小相对约简,将信息论角度定义的属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法。通过构造一个新的算子来引入启发式信息,使得选择的属性子集的分类能力不变。该算子体现了一种利用启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度。从理论上对算法作了分析,对新算子所能选择属性子集的分类能力不变作了证明。最后的实例表明,该算法能有效地对决策系统进行最大程度的约简。  相似文献   

5.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

6.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

7.
一种基于差别矩阵的属性约简完备算法   总被引:15,自引:0,他引:15  
提出了一种基于差别矩阵的粗糙集属性约简完备算法,算法的求解策略是在每次迭代过程中只选择必要的条件属性,如果在某次迭代过程中找不到这样的条件属性,则任意排除一条件属性,为下一次迭代中找到必要的条件属性做准备.分析了算法在最坏情况下的时间复杂性,给出了该算法相对Pawlak约简的完备性的证明.同已有的同类约简算法相比,该算法在最坏情况下具有更小的时间复杂性.  相似文献   

8.
信息系统作为一种基本的数学模型广泛应用于人工智能的各个分支,例如分类问题、专家系统、决策支持、上下文分析和数据挖掘.而属性约简是信息系统研究的基本问题.文章提出了近似空间映射(ASM)的概念,并讨论了它与属性约简的关系,提出了基于ASM的属性约简新算法.  相似文献   

9.
为了提高无核或少核序决策信息系统中现有属性约简算法的执行效率,本文以知识粒度表征的属性重要度为启发信息并结合前向属性约简方法提出了一种新的属性约简算法。首先,介绍优势粗糙集方法的相关基础知识,并将经典粗糙集中基于知识粒度的属性约简算法引入优势粗糙集方法中,得到可处理序决策信息系统的属性约简算法;然后,通过分析序决策信息系统中知识粒在属性数目变化条件下的粗化与细化过程,得出相对冗余属性的判断定理,由此结合前向属性约简方法设计了快速属性约简算法;最后分析比较了2种算法的时间复杂度并选取了6个不同的UCI数据集进行算法性能的测试,测试结果表明,本文提出的算法比现有的属性约简算法高效。  相似文献   

10.
基于差别矩阵的增量式属性约简完备算法   总被引:1,自引:0,他引:1  
为了解决基于差别矩阵的属性约简完备算法得不到最小约简的问题,提出了一种改进的属性约简方法.该方法将信息论定义的属性重要性作为启发式信息,并通过构造一个条件信息熵算子对差别集合进行运算,同时利用算子来计算候选属性的剔除次序,采用宽度优先搜索策略使约简集合中含有最重要的属性,这样就解决了完备算法约简率低的问题.结合该方法并在分析对象集增量与差别矩阵关系的基础上,证明了增量约简定理,由此提出了一种增量式约简完备算法(CAIR),当新数据加入决策表时,算法可增量构造差别集合.实验结果表明,所提CAIR在大大缩短计算差别集合时间的同时,约简率比非完备算法提高了20.3%,是同条件下完备算法执行效率的13.2倍.  相似文献   

11.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

12.
基于关系积的属性约简算法   总被引:1,自引:0,他引:1  
粗糙集的属性约简是一个NP难问题,目前尚无高效的算法.基于集合理论,提出了关系积概念和基于关系积的属性约简算法,把决策表的属性约简过程转化为关系积的运算,减小了对决策表的扫描次数,提高了属性约简的效率;算法采用自底向上和宽度优先的搜索策略,可确保找到最小属性约简集.结合实例,给出了算法的具体实现.  相似文献   

13.
通过粗糙集理论对一种实值属性约简算法进行了研究,给出了实值决策系统属性约简的算法,并采用UCI中的数据集进行分析,实验结果表明:该约简方法可以选择较少的属性而保持或改善分类能力.  相似文献   

14.
为解决属性约简的诸多问题,比如基于信息熵的属性约简方法偏向多值属性的缺点,而基于属性相似度的属性约简方法偏向少值属性的不足,现提出一种将信息熵和属性相似度结合起来的新的启发式属性约简方法.实验结果表明,避免了上述两种属性约简算法的偏向性.  相似文献   

15.
利用近似质量作为度量标准,借助启发式算法求解约简,其本质是根据近似质量的变化情况来找出冗余属性,但这一方法其并未考虑每一个决策类别所对应的下近似集合在约简前后的变化程度.鉴于此,提出了一种基于类别近似质量的属性约简策略,其目标是使得每一个类别的近似质量都满足约简的约束条件.借助邻域粗糙集模型,在UCI数据集上将传统约简策略与类别近似质量约简策略进行了对比分析,实验结果不仅验证了类别近似质量约简策略的有效性,而且表明这种策略依然能够满足传统约简的约束条件.  相似文献   

16.
基于决策支持度的不完备信息系统约简算法   总被引:1,自引:0,他引:1  
提出了一种基于决策属性支持度的属性相对约简算法。通过引入决策属性支持度对不完备决策表中属性的重要性进行了定义,并以此作为启发信息进行属性的选择,该算法的时间复杂度是多项式的。寻找决策表中最小相对约简问题是典型的NP-hard问题,采用该算法可降低问题复杂度。通过实例说明,该算法能得到不完备决策表的最小相对约简。  相似文献   

17.
提出了一种基于论域离散度的适应度函数,在前向贪心搜索策略下,以该适应度函数评估条件属性的重要性,进而求取邻域粗糙集的约简。该算法与3个比较流行的属性约简算法进行对比实验,在12组UCI数据集上进行验证。实验结果表明,与另外3种算法相比,在不降低分类效果的情况下,本文算法在时间消耗和稳定性上具有较为明显的优势。  相似文献   

18.
样本信息处理中一种属性约简方法的研究   总被引:10,自引:1,他引:10  
为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似精度科学地定义了条件属性重要性,进而提出一种对样本信息进行属性约简的有效、简便方法.该方法主要包括信息核的求取、可省条件属性的重要性计算和相对属性约简集的确定.其中,为连续属性的离散化处理提供了一种基于模糊相似比原理的快速离散化算法,它能起到剔除模糊噪声的作用.典型实例计算和在油水层识别系统中的实际应用表明,这种属性约简方法的识别准确率可达90%以上,应用效果显著.  相似文献   

19.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号