首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
通过粗糙集理论对一种实值属性约简算法进行了研究,给出了实值决策系统属性约简的算法,并采用UCI中的数据集进行分析,实验结果表明:该约简方法可以选择较少的属性而保持或改善分类能力.  相似文献   

2.
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要度的快速属性约简算法。首先,提出一种改进的KNN属性重要度;其次,利用改进过属性重要度的邻域粗糙集对原始数据的条件属性进行重要度排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精度和较快运行速度。  相似文献   

3.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

4.
基于属性约简的PLS加权朴素贝叶斯分类   总被引:1,自引:0,他引:1  
朴素贝叶斯算法是一种简单而高效的分类算法,它的属性独立性假设,影响了它的分类性能.针对这种问题,在分析属性相关性的基础上,通过属性约简选择一组近似独立的属性约简子集,提出一种基于属性约简的偏最小二乘回归加权朴素贝叶斯分类算法.对不同的条件属性给予不同的权值,从而在保持简单性的基础上有效地提高了朴素贝叶斯分类算法的分类性能.实验结果表明,该方法可行且有效.  相似文献   

5.
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

6.
基于粗糙集的属性约简算法研究   总被引:20,自引:1,他引:19  
提出一种新的基于粗糙集的属性约简算法.该算法采用层次结构和近似精度的概念,约简集中的属性选择从空集开始,用启发函数ξ作为选择条件属性的衡量标准,逐步加入相对于决策而言重要的条件属性,并采用下近似值作为剪枝依据,逐步删除给定论域U中根据该属性子集能完全正确分类的对象,减小了属性约简过程中的搜索空间,处理过程是递归的,直到给定论域U为空集,保证了在分类精度不变的情况下,获得简化的属性集,最后运用粗糙集中正域的概念,约简冗余的属性值并求出其最简规则.对UCI机器学习数据库中7个数据库属性约简结果证明了该算法的正确性和可行性.  相似文献   

7.
数据挖掘分类问题的贪婪粗糙集约简算法   总被引:7,自引:0,他引:7  
基于贪婪算法和粗糙集方法,给出了一种处理数据挖掘分类问题的属性约简算法:贪婪粗糙集约简算法GRSR;在测试中得出的约简集为原始集的1/3,表明了它是一个有效的算法·其想法是:从初始约简集为空集开始,选择使分类质量最大的属性,将它加入约简集;再从余下的属性中选择使分类质量最大的属性并加入约简集,重复直至找到满意的约简集·  相似文献   

8.
属性约简分类是粗糙集在数据挖掘中一个重要的研究方向.其大多数研究是基于小规模空间信息系统;基因表达式编程是一种新出现的进化算法,具有高度并行、极强的函数挖掘的特点.提出了将粗糙集中的充要强度作为GEP的适应度函数,创建一种新的属性约简分类算法,以减少粗糙集在大规模知识库中知识约简的复杂程度,加快收敛速度.  相似文献   

9.
属性约简是粗糙集理论研究的核心内容。目前已有的研究成果往往是根据分类性能、代价或不确定性等一些度量来定义及求解约简,并未充分考虑数据扰动有可能对约简结果产生的波动影响。为解决这一问题,提出了一种可以求解稳定约简的启发式算法框架:首先,在全体样本集上利用多次聚类进行多重采样以得到若干边界样本集合;其次,利用集成策略,对每一个属性在所有边界样本集合上求得的重要度进行融合;最后,选择重要度较高的属性加入到约简集合中。在8个UCI数据集上将新算法与传统算法进行对比分析,实验结果表明当数据发生扰动时,所提出的方法不仅能够有效地提升求解约简的时间效率与约简结果的稳定性,而且依据约简所求得分类结果的稳定性也有显著增强。  相似文献   

10.
在数据挖掘和机器学习的过程中,分类器的主要任务是提高数据分类的精确度和降低数据分类的费用开销,本文针对传统分类器只考虑了如何提高数据分类的精确度而没有考虑到如何降低数据分类的开销缺陷,提出了一种基于属性开销约束的矩阵属性约简算法,定义了一种新的函数作为属性约简的启发信息,探讨了基于矩阵方法计算等价关系矩阵的增量更新机制.该算法缩短了粗糙集属性约简的计算时间,保证了属性约简的实时性,并通过实例进一步验证了所提出方法的有效性和正确性.  相似文献   

11.
洪月华  徐霜  梁家荣 《广西科学》2013,20(2):128-131,136
为了实现对无线传感器网络监测得到的高维冗余且不确定的数据进行分类识别,提出一种由遗传算法和粗糙集进行优化的BP神经网络数据分类器模型,并形成了数据挖掘分类算法。该模型通过粗糙集理论的属性约简算法删除训练样本的冗余属性,利用遗传算法对神经网络的权值和阈值进行优化,并进行神经网络学习。数据挖掘分类算法学习速度快,能够有效提高无线传感器网络中数据的分类效率。  相似文献   

12.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

13.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

14.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

15.
本文根据一种基于粗糙集理论的数据挖掘方法,以路口检测数据为研究对象,通过记录数据形成原始的决策表,后通过改进的Semi Naive Scaler算法对原始决策表进行数据预处理,最后对数据预处理后的决策表采用基于可辨识矩阵的属性频度的启发式约简算法进行属性约简,得出的约简结果为关键的属性,即关键的相位,根据程序实现结果为道路决策部门提供依据。  相似文献   

16.
提出了一种基于训练集中已有类别的数学期望的分类算法,该算法先将离散属性值映射为相应的数值,并计算各类别中各属性的数学期望,以各类别中各属性的数学期望为坐标,当有新的数据需要进行类别判定时,只要以新数据的属性为坐标,求取其到各个类别的距离,距离最短的类别即为该数据所属类别。该算法不受属性离散性及类别个数限制,可用于属性类别不统一(既有离散型属性,又有连续型属性),且所属类别数较多的分类情况。  相似文献   

17.
海量数据属性约简的研究是数据挖掘研究中的一个难点。已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理。结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法。利用该算法可以快速得到海量数据的属性约简结果。仿真实验结果说明了该算法的高效性。  相似文献   

18.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号