首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
从事务数据、时间序列数据等数据库中挖掘频繁模式已在数据挖掘领域中得到了广泛地研究.针对目前已有的Apriori算法和频繁模式增长算法在时间和空间等方面的复杂性和低效性,提出了一种新的数据结构——事务模式树,用来存放待挖掘的事务信息,同时给出一种基于该数据结构的挖掘算法——事务模式树分层挖掘算法.最后,把该算法应用于保险业务.结果表明,该算法简单高效,值得推广.  相似文献   

2.
频繁模式挖掘是数据挖掘中的一个重要方向,对频繁模式的挖掘也存在多种不同的算法。本文提出一种以堆栈为辅助构造频繁模式挖掘的搜索树,从而用最少的数据扫描次数挖掘出数据库中存在的频繁模式的算法。该算法利用堆栈的递归性,尽可能减少了搜索树构造过程中造成的分支数目,即减少频繁模式挖掘中的数据扫描次数。  相似文献   

3.
回归分析在连续型数据目标预测中的应用   总被引:1,自引:0,他引:1  
数据挖掘能从已有的大量数据中抽取隐含的、以前未知的、具有潜在应用价值的信息或模式.如何从数据仓库中提取知识辅助用户决策是开发决策支持系统必须解决的问题.针对所开发工业企业市场营销决策支持系统时遇到的连续型数据目标预测问题,选用回归分析方法,系统地探讨了如何建立挖掘模型和设计挖掘算法等问题,并将其用于销售预测.对模拟数据进行处理,结果表明算法能实现预期效果.  相似文献   

4.
主流数据挖掘算法不能有效解决大规模数值数据集挖掘问题。提出了一种应用于大规模数值数据集的线性时间封闭项集挖掘改进(Improved Linear time Closed Itemsets Minner, ILCM)算法。ILCM算法使用能够提取属性共同变化量的渐进模式挖掘方法,借鉴LCM算法的前缀保留闭合扩展思想,通过深度优先搜索输出频繁封闭渐进项集结果。实验证明,相比传统挖掘算法,ILCM能够显著提高算法运行效率和降低内存空间占用,并且能够有效处理如DNA微阵列等实际大型数值数据集挖掘。  相似文献   

5.
频繁模式挖掘是数据挖掘研究中的关键问题之一,在关联规则等领域应用广泛.概念格是数据分析和知识表示的一种有效工具,适用于从数据库中挖掘规则的问题描述.分析了概念格在频繁模式挖掘的应用,包括对普通事务项集、序列项集及格、树和图等复杂结构的挖掘;讨论了概念格构造优化的必要性及两类主要的优化方法属性约简和剪枝概念格;并对关联规则提取的方法的优劣进行了基本比较,最后探讨了概念格未来的研究方向.  相似文献   

6.
针对现有入侵检测系统在处理大量数据时,挖掘速度慢,自适应能力差的缺点,引入了数据挖掘技术使其能从大量数据中发现入侵特征和模式,提出了一种基于数据挖掘技术的入侵检测系统模型,并研究了建模过程中用到的算法.  相似文献   

7.
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此,不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁模式挖掘是不确定数据挖掘的一个重要的研究内容,它是确定数据库中的频繁模式挖掘问题在不确定数据环境下的扩展研究,即挖掘在数据库中经常共同出现的模式。为了提高记录级不确定数据库的概率频繁模式的挖掘算法的效率,本文提出一种基于FP_Growth算法的概率频繁模式挖掘算法,并在不确定数据库上实验验证了算法的性能。  相似文献   

8.
针对目前动态数据挖掘中存在的问题,提出基于数据增量的动态挖掘进程概念;在动态挖掘进程和生物免疫进化过程的相似性基础上,提出了知识发现中的免疫进化机制的基本内涵;给出了基于免疫进化机制的时序模式挖掘算法及其实验分析,以验证理论的正确性和有效性。  相似文献   

9.
智能手机已经成为个人行为的真实记录设备,对APP使用数据进行挖掘可以提取出用户的行为习惯.为了提取APP的使用关联模式,研究并提出基于数据挖掘的APP关联规则提取技术.首先,基于Android平台,开发APP状态数据收集平台;其次,对APP数据进行预处理;再次,基于Apriori算法,提出了APP关联规则挖掘算法;最后,应用真实个人APP使用数据,对提出的方法进行验证,实验结果证明本文提出的方法在APP关联规则挖掘中的可行性.  相似文献   

10.
高频独立模式对无相关属性选择有一定意义.给出挖掘频繁独立模式算法,并在标准数据挖掘数据集蘑菇数据上测试,得到蘑菇数据在一定度量下的所有频繁独立模式,实验结果表明了挖掘算法的有效性.  相似文献   

11.
基于小波数据结构设计了一种用于挖掘新的周期模式(RPP)的算法.该周期模式不同于以支持度为度量标准挖掘的周期或半周期模式,它能有效地发现RPP中P=〈Am→Bn〉这样的模式.实验证明该算法是有效的,且具有很好的延展性.  相似文献   

12.
频繁模式不能反映模式内部各项目之间的关联和相关关系,频繁关联模式挖掘与孥繁相关苎式兰苎已越来越受到人们的重视.按照相关模式定义,如果一个模式是相关模式,其超模式一定是相关模式,最小频繁相关模式挖掘将大大减少挖掘出来的数量,有利于用户分析.给出最小频繁相关模式挖掘算法,并在标准数据挖掘数据集蘑菇数据上测试,实验证明算法是正确有效的.  相似文献   

13.
Clustering, in data mining, is a useful technique for discovering interesting data distributions and patterns in the underlying data, and has many application fields, such as statistical data analysis, pattern recognition, image processing, and etc. We combine sampling technique with DBSCAN algorithm to cluster large spatial databases, and two sampling-based DBSCAN (SDBSCAN) algorithms are developed. One algorithm introduces sampling technique inside DBSCAN, and the other uses sampling procedure outside DBSCAN. Experimental results demonstrate that our algorithms are effective and efficient in clustering largescale spatial databases.  相似文献   

14.
在交易数据库的挖掘研究中,模式未来行为的预测已成为用户关注的焦点。通常是通过分析和挖掘历史交易数据库中的数据得到模式未来行为——频繁出现程度,以便帮助用户决策。为解决这类问题,设计一个基于回归法的算法挖掘一类新模型超期望模式。实验结果表明这种模式在模式评价和模式预测方面很有效,它同时为减少冗余规则提供了一种可行的方法。  相似文献   

15.
将Web使用挖掘应用到网络教育领域,分析了其挖掘过程,包括数据采集、数据预处理、模式发现和模式分析;通过建立网络教育资源导航模型,并利用蚁群算法对Web日志数据中使用者的浏览行为进行挖掘;提出一个新的导航路径挖掘算法,可以发现有价值的用户浏览模式,指导用户对教育资源作进一步的搜索,还可以将训练好的网络图用于用户的个性化定制服务。  相似文献   

16.
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法--FStreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT相比具有较高的效率,是有效可行的.  相似文献   

17.
目前采用博弈分析和流量预测等模型,对未来时间段道路网货运车辆超限行为进行提前识别,取得一定的检测效果,但对具有时空动态性和迁移性的超限车辆分布挖掘仍具有局限性.根据道路网超限车辆数据特点,提出一种基于弱关联频繁模式的超限行为的挖掘优化算法,该算法采用空间弱关联频繁模式构建的超限频繁模式树,建立时间弱关联的状态转移模型,得到频繁模式的预测值.在FP-growth频繁模式挖掘算法的基础上,首次建立了超限模式挖掘与货运车辆行为数据的时空弱关联,使超限行为预测算法误差率降至6%以下,有效提高了超限行为的检测效率.  相似文献   

18.
数据挖掘算法对于支持度改变及数据集更新的适应性一直都是一个难点.本文根据数据集逐步增加的增量式方法,映射事务模式于线性空间中进行挖掘,并借助了图像在操作系统中显示及存储的特点,提出了一种新的增量式数据挖掘算法IPM-DM.同时,对比分析了其中两种模式映射方法,并与同类算法比较,经过实验证明,算法IPM-DM是有效且可行的.  相似文献   

19.
介绍了数据挖掘、网络挖掘和网络用法挖掘技术的理论发展及其它们在实际中的应用情况,并在挖掘算法的改善提高过程中进行了探索性的研究.为了有效地帮助Web站点管理员管理Web站点,帮助商家调整整个市场策略,提出了一种在给定的Web日志中利用事务数据库中的挖掘序列模式的方法来发现所有的大访问路径的算法.结果证明该算法是行之有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号