首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 168 毫秒
1.
针对数据流环境中混合多种类型概念漂移问题,提出了基于图模型的数据流分类算法.该算法通过对数据块上的实例集进行概念表示,检测概念的变化度来衡量概念漂移,并引入了一个动态自适应阈值,为每个待分类实例合理选择基分类器模型,充分利用基分类器模型潜在的多样性并降低漂移恢复期间的分类误差.实验表明,本文提出的算法性能在多数数据集上优于其他算法,在复杂概念漂移环境下具有较好的适应性.  相似文献   

2.
将粒计算融入到概念格研究中,结合相似度模型和概念格结构信息,提出一种基于粒计算的概念格拓展模型,其有助于扩展经典概念的内涵和外延,也有助于压缩概念的规模.该模型是概念格和粒计算融合研究的一次有益探索和尝试,同时对概念格拓展也不失为一种有效手段.  相似文献   

3.
数据流的特征是海量的、高速流动的、实时处理的.由于一些数据分布随着时间而改变,因此将这些数据流称为概念漂移.首先按照分类模型对数据流决策树进行分类,分为单分类决策树和集成分类决策树.单分类模型分为快速决策树、变异决策树和其他决策树算法.集成分类模型分为衍生快速决策树和随机决策树变体算法.其次介绍了概念漂移处理技术,包括概念漂移问题的描述、常见的概念漂移处理技术和用于解决概念漂移的决策树算法.接着介绍了增量模型决策树算法,最后对本文介绍的决策树算法进行分析总结.  相似文献   

4.
在数据流分类学习过程中,类不平衡和概念漂移是两大挑战问题.在分析传统特征选择算法和代价敏感学习方法的基础上,将代价敏感学习算法的思想引入特征选择算法中,设计并实现了一种基于代价敏感的Relief F剪枝的数据流分类算法,不仅能删除冗余的特征,而且适应动态变化的数据流环境.与经典的算法进行分析比较,结果表明所提算法可显著提升分类效果.  相似文献   

5.
粒计算是一种利用粒化信息的思想解决复杂问题的方法和有效工具。在粒化的过程中常常需要对粒进行描述,因此粒描述成为了粒计算的一个基本问题。本文在考虑基于必然属性分析的粒描述基础上,提出了基于可能属性分析的粒描述。首先,将面向属性概念的外延看作形式背景上的可定义粒,给出了可定义粒的描述方式;然后,利用概念的稳定性,给出概念的极小生成子对可定义粒进行精简化描述;最后,通过任务分配的例子说明基于可能属性分析的粒描述的优势。  相似文献   

6.
数据流分类模型是面向连续变化的实时分析的基本问题.目前大多数的数据流算法只针对突变式或渐变式概念漂移进行处理的,并未充分考虑概念会重现的特点.为此提出了一种具有概念漂移检测机制的自适应集成算法.从信息熵的角度出发,用Jensen-Shannon散度度量相邻两个窗口间数据分布的距离,不仅能检测出不同类型的概念漂移,且能有效地发现重现的概念;采用分类器池机制来保存历史概念,从而实现对概念的重用.将所提出的算法与几种经典的学习算法在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明,所提出的算法在平均分类准确率上具有明显的优势,比其他集成算法消耗更少的时间,适合多种类型概念漂移的环境,并具有较高的抗噪性.  相似文献   

7.
决策形式背景是在形式背景的基础上通过增加决策属性而得到的,相应的可生成条件格和决策格。基于这两个格中属性概念外延之间的关系提出属性粒协调决策形式背景这一概念,并从属性概念的角度给出决策形式背景现有的强协调性、弱协调性和协调性的新的描述方式,进一步解释属性粒协调决策形式背景与这三种决策形式背景之间的关系;最后,提出属性粒规则的概念,并给出以此为基础的规则获取方法。  相似文献   

8.
在作者提出的粒计算新模型──粒集理论的基础上,提出了粒系统、概念粒系统和粒概念等概念,并对它们分别进行了描述,其中粒系统的描述是五元组形式,即(U,D,L,H,J).当约束J的形式为一种特殊形式,即为概念中内涵与外延间反变关系的数学描述时,(U,D,L,H,J)就是概念粒系统.由此给出了概念粒系统的一些基本数学性质,证明了全体粒概念构成一个完备格──粒概念格,同时初步探讨了形式背景与概念粒系统之间的关系,从而进一步扩充了粒集理论的内容,完善了粒集理论.  相似文献   

9.
概念漂移是数据流挖掘的一个研究热点与难点,判断认知收敛是研究盲区.粗糙集已被应用于概念漂移探测,但存在适应性问题,缺少增量式概念漂移的相关研究.针对上述问题,运用粗糙集理论,从单条决策规则和整体决策系统的角度出发,引入决策优势函数与漂移度,对增量式概念漂移的适应与认知收敛问题作了较为深入的研究,提出一种基于决策支持度阈值的增量式规则更新算法.理论分析与仿真实验表明:新算法在适应概念漂移和学习新知识时较其他算法更为敏感且高效,对概念飘移的研究策略有效可行.  相似文献   

10.
隐含概念漂移的数据流分类问题是数据挖掘领域研究的热点之一,而实际数据中的噪音会直接影响概念漂移检测及分类质量,因此具有良好抗噪性能的数据流分类方法具有重要的研究和应用价值.随机决策树的集成模型是一种有效的数据流分类模型,为此本文基于随机决策树,引入Hoeffding Bounds不等式来检测和区分概念漂移和噪音,根据检测结果动态调整滑动窗口的大小和漂移检测周期,并提出一种增量式的集成分类方法ICDC,实验结果表明,本文算法在含噪音数据流上处理概念漂移是有效的.  相似文献   

11.
陈庆燕  崔娟 《科技资讯》2010,(30):46-47
概念格作为形式概念分析理论中的核心数据结构,已经在很多领域得到了广泛的应用,国内外的研究人员已经提出一系列的构造概念格的算法。本文给出了三种算法的构造思想及理论上最坏情况下的时间复杂度,并通过实验分析了各种算法当参数变化时它们的时间复杂度的变化趋势。  相似文献   

12.
提出了基于随机标记子集的多标记数据流分类算法,其基本思想是在多标记分类过程中,将原始较大的标记集随机地划分为多个较小的标记子集,并针对每个标记子集训练一个概率分类器链.在充分利用标记间依赖关系的同时,又有效地降低了概率分类器链的时间复杂度.同时,在算法中嵌入了自适应滑动窗口算法来检测概念漂移.实验结果表明,同其他算法相比,在大多数数据集合上能够更有效地预测实例的类标集合,更适合概念漂移的环境.  相似文献   

13.
概念漂移给数据流挖掘工作带来了很大阻碍.经典的SEA算法通过动态裁剪集成分类器的方式有效地捕获到概念漂移.其裁剪集成分类器的策略是直接删除掉一个权值最低的基础分类器,这意味着算法抛弃了一个已经学习了的概念,当该概念再出现时还需再学习,导致算法效率的降低.现提出了一种能够提取旧概念的算法(ECRRC),并给出了存储和提取概念的具体方法.面对概念的重复出现,ECRRC不用再学习就能够完成数据流分类.实验结果表明,ECRRC能够提高数据流分类效率.  相似文献   

14.
形式化概念分析已被证明是一种支持模块重组的有效工具.然而,在使用概念分析进行模块重组时,仍存在一些问题有待进一步解决.本文提出一种自动化的遗留软件重组方法,用于从识别的模块化方案中获取一种最佳解决方案.通过在概念分析过程中引入概念抽象、哑概念和概念相似性度量等新的特性,有助于解决现有方法的不足.概念抽象用于表示候选模块...  相似文献   

15.
概念格与粗糙集   总被引:7,自引:0,他引:7  
概念格与粗糙集都是有效的数据分析方法,它们已广泛应用于机器学习、人工智能、知识发现等领域.概念格与粗糙集在数据分析方面有相似之处,并且粗糙集的一些概念包括等价类,上、下近似等都可以通过概念格来表示.论述了概念格与粗糙集之间的联系,建立了它们之间的关系,并通过实例进行了解释.  相似文献   

16.
网络上的概念认知是网络数据分析领域的一个重要方向。从形式概念分析中的必然算子、可能算子出发,提出变精度可能算子,表明经典可能算子是变精度可能算子的特殊情形;进一步,对可能算子的性质进行研究,并解释它们在传染病网络研究中的意义;接着,根据变精度可能算子提出两种网络广义概念及其上下近似与边界,通过实例说明基于变精度可能算子的上下近似和边界在网络概念认知中具有更丰富的语义;然后,结合复杂网络分析中的网络特征值方法,定义网络弱概念,并提出基于变精度可能算子的网络弱概念获取方法;最后,利用文中算法在UCI数据集上进行测试,结果证实了变精度可能算子在网络概念认知中的优势。  相似文献   

17.
基于矩阵列秩的理论以及概念对并运算封闭的特征,提出了一种基于矩阵列秩属性优先的概念格的生成算法.首先,将形式概念分析中数据的形式背景看成一个0-1矩阵,利用矩阵的秩定义出概念的秩.其次,通过概念的秩的定义和概念对并运算封闭的特征,对概念按秩进行分层提取.通过对形式概念分析中数据的形式背景与矩阵的某些性质之间的联系的探索以及实例的验证,表明该算法行之有效.  相似文献   

18.
分类是数据挖掘中的一个重要问题.概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在量化的相对约简格基础上,提出一种新的分类规则发现算法,该算法的生成结果剔除了冗余的分类规则,算法在时间性能、空间性能等方面均有较大的提高.  相似文献   

19.
概念格及其应用进展   总被引:60,自引:0,他引:60  
概念格是近年来获得飞速发展的数据分析的有力工具。从数据集中生成概念格的过程实质上是一种概念聚类过程。然而 ,概念格可以用于许多机器学习的任务 ,例如分类 ,关联规则的挖掘等。论文介绍了概念格的基本概念 ,讨论了现有的几种建格算法和在格上提取规则的方法及相关系统和应用。另外 ,还介绍了格的剪枝及概念格和另一个新型数据分析工具粗糙集之间的关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号