首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
为了提高分类的精确度,提出一种基于粗糙集理论的增强学习型分类器。采用分割算法对训练数据集中连续的属性进行离散处理;利用粗糙集理论获取约简集,从中选择一个能提供最高分类精确度的约简。对于不同的测试数据,由于离散属性值的变化,相同的约简可能达不到最高的分类精确度。为克服此问题,改进了Q学习算法,使其全面系统地解决离散化和特征选择问题,因此不同的属性可以学习到最佳的分割值,使相应的约简产生最大分类精确度。实验结果表明.该分类器能达到98%的精确度.与其它分类器相比.表现出较好的性能。  相似文献   

2.
入侵检测需要分析大量的高维样本数据.如何降低高维样本数据的特征维数,对于降低入侵检测系统的训练时间,提高检测精度和检测实时性具有十分重要的意义.提出基于特征相关性分析和基于特征属性重要性评价两种特征选择方法,并利用支持向量机作为分类器来评价不同特征约简方法的有效性和处理实时性.实验结果表明,同经典的主成分分析方法相比,两种特征约简算法都具有较好的处理实时性和较高的分类精度,其中基于属性重要度约简算法在数据预处理时间、训练时间和分类精度上同主成分分析方法相当,且略优于相关性尺度方法.  相似文献   

3.
考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.  相似文献   

4.
针对连续型数据的属性约简问题, 提出了一种新的属性约简方法[CD2]基于分配可辨识矩阵的属性约简方法。给出了基于连续型数据的分配协调集的概念, 研究了基于连续型数据的分配协调集的基本性质, 定义了基于分配协调集的辨识矩阵。在此基础上提出了基于辨识矩阵的连续型数据的属性约简方法, 并给出了计算辨识矩阵的算法。实例分析表明, 该方法能有效地对连续型数据进行属性约简。  相似文献   

5.
针对不完备信息提出一种新的基于矩阵方法的极大相容块求取算法与属性约简方法,结合智能分类器给出不完备信息条件下的故障诊断方法 .首先,通过矩阵方法计算不完备决策表中的极大相容块;然后,利用所求得的极大相容块,提出一种新的属性约简算法,并与其他方法做对比;最后,将所提出的基于极大相容块的属性约简方法与智能分类器(支持向量机、随机森林、决策树等)结合,建立优化的智能故障分类器,将它应用于不完备信息条件下的故障诊断.以汽轮机组的故障诊断为例进行仿真实验,实验结果表明提出的针对不完备信息条件下的故障诊断方法可行、有效.  相似文献   

6.
基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果.  相似文献   

7.
针对不完备信息提出一种新的基于矩阵方法的极大相容块求取算法与属性约简方法,结合智能分类器给出不完备信息条件下的故障诊断方法 .首先,通过矩阵方法计算不完备决策表中的极大相容块;然后,利用所求得的极大相容块,提出一种新的属性约简算法,并与其他方法做对比;最后,将所提出的基于极大相容块的属性约简方法与智能分类器(支持向量机、随机森林、决策树等)结合,建立优化的智能故障分类器,将它应用于不完备信息条件下的故障诊断.以汽轮机组的故障诊断为例进行仿真实验,实验结果表明提出的针对不完备信息条件下的故障诊断方法可行、有效.  相似文献   

8.
针对决策信息系统属性增加且属性值发生细化的情况下如何快速更新属性约简的问题,探讨了基于矩阵方法计算决策信息系统相对知识粒度的增量更新机理,设计了属性增加且属性值发生细化的矩阵增量约简算法。当决策表中的属性值细化且决策表中属性增加时,所提出的增量约简算法与非增量约简算法及其他增量约简算法相比,约简的分类精度变化不大,但是能够大大缩短计算约简的运行时间。最后利用一些UCI数据集做了大量仿真实验,仿真结果验证了所给出的动态属性约简算法能够有效地解决动态数据约简的问题。  相似文献   

9.
基于二进制可辨矩阵的属性约简启发式算法   总被引:1,自引:0,他引:1       下载免费PDF全文
对文献[2]的可辨矩阵约简变换算法进行改进,利用核属性特性减少比较次数,提高算法的效率.充分考虑决策表的启发性知识,提出一种新的属性重要性计算方法.最后,给出一种基于二进制可辨矩阵的属性约简启发式算法.  相似文献   

10.
属性约简是粗糙集理论研究的一个基本问题,它是一种有效的数据约简方法。然而,目前很多的属性约简算法在面对高维数据集时仍然不够高效。文中利用图论的相关理论和方法,对基于区分矩阵的粗糙集属性约简方法给出了直观和等价的刻画。在此基础上提出了基于图论的粗糙集属性约简方法。实验结果表明,新的属性约简算法在面对较大规模的数据集,尤其是高维的数据集时,不仅能有效地降低数据的维数,同时运行速度快且能保持较高的分类精度。  相似文献   

11.
可辨识矩阵是粗集理论中可以标识决策属性和条件属性之间关系的矩阵.根据数据库的动态建立特性,提出了一种基于粗集理论中的可辨识矩阵的动态属性约简算法,利用数据的动态性和可辨识矩阵的特性对己有的属性约简进行修正,并通过实例证明了这种算法的有效性,该算法极大地节省了计算量,提高了算法的执行效率.  相似文献   

12.
针对多维数据集的关联规则挖掘,提出了一种基于反区分矩阵的方法.首先由数据集同步得出区分矩阵和反区分矩阵,然后根据区分矩阵进行属性约简,再根据反区分矩阵找出约简后的频繁项集,最后给出关联规则.通过区分矩阵和反区分矩阵将属性约简和关联规则挖掘联系起来,减少了计算步骤,且算法只需扫描数据集一次,避免了繁琐的连接操作.应用实例表明该算法是一种合理有效的关联规则挖掘方法.  相似文献   

13.
基于粗糙集理论,改进了C-D分辨矩阵,并设计了计算条件核属性的方法。通过分析指出了第二种条件核属性的计算方法,可以避免求取C-D分辨矩阵,降低程序的复杂度。以条件核属性为基础,提出一种适用于获取模糊规则的数据约简算法,并通过仿真研究说明了该数据约简、模糊规则挖掘方法的有效性。  相似文献   

14.
传统邻域分类器因良好的分类性能在分类问题中得到广泛应用。但数据规模和维度的不断增加,提高了邻域分类器的处理难度。为解决这一问题,该文基于Spark实现邻域决策错误率并行属性约简算法,删除数据中的冗余属性,减少数据间的不确定性。该算法能减少分类过程中数据计算时间,提高分类计算效率。邻域分类器在分类决策过程中采用的多数投票机制没有考虑到邻域样本的空间差异性与标签不确定性,易导致错误分类。该文在Spark框架下将D-S证据理论引入邻域分类器,并行融合整个邻域空间的证据支持信息,提出基于Spark的邻域证据并行分类算法。实验结果表明,该文提出的算法相较于传统邻域分类器,在处理大规模数据时计算时间更少、效率更高,对未分类样本的分类精度更高。  相似文献   

15.
提出一种新的学习无约束贝叶斯网络分类器的算法(RE-BNC).该算法基于粗糙集理论,在保证分类精度不变的前提下,先对冗余属性变量进行约简,降低属性变量维数,然后构建一个无约束优化模型用来学习较好的初始种群,降低搜索空间,再结合进化算法学习分类器的网络结构.与其他常见的8种分类器算法相比较,实验结果表明该算法设计合理,且分类效果较好.  相似文献   

16.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

17.
基于邻域决策错误率的属性约简可以在删除冗余属性的同时,提升邻域分类器的留一验证分类精度.但这种约简方式并未充分考虑邻域分类结果在约简前后的差异.为解决这一问题,借助联合分布矩阵,提出了邻域决策一致性的概念,构建了邻域决策一致性与邻域分类精度的调和平均值,并将其作为约简求解的度量准则.在12个UCI数据集上的实验结果表明,所提出的新约简不仅能够有效地提升邻域分类器的决策一致性,而且在多数情况下能够进一步提高邻域分类器的留一验证分类精度.  相似文献   

18.
二进制粒神经网络及其在分类中的应用   总被引:1,自引:0,他引:1  
为了提高分类器的正确识别率并降低特征选择的时间复杂度, 提出二进制粒神经网络框架.在该框架下,提出一种二进制粒神经网络分类算法.该算法通过二进制粒矩阵将特征空间进行最优约简,并利用基于BP的学习算法实现分类;将该算法在UCI数据集上进行测试,并与BP神经网络分类算法进行比较.仿真实验表明,二进制粒神经网络分类算法比BP神经网络分类算法分类正确率更高,泛化能力更强,是一种有效可行的分类算法.  相似文献   

19.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

20.
模糊C-means算法是一种重要的聚类分析算法,但是在数据维数较高的情况下,该算法计算量急剧上升从而导致其效率较低.针对这一问题,提出了一种基于粗糙集理论的模糊C-means高维数据聚类算法,该算法在传统模糊C-means算法的基础上引入了粗糙集属性约简的理念,通过对数据集属性的约简,提取出对分类影响较大的属性集而摒弃与分类无关的属性,进而在聚类过程中只计算属性约简结果集中的属性,从而减少聚类过程的工作量、提高聚类效率.理论分析和实验结果表明,该算法在处理高维数据时较高效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号