首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
基于广义后缀树的事件序列频繁情节挖掘算法   总被引:1,自引:0,他引:1  
为了有效地挖掘事件序列频繁情节,提出了一种广义后缀树结构发现和存储频繁情节. 此结构利用广义后缀概念并且树中只包含频繁情节结点,用频繁情节发生列表逐层构建的方法提高了建树效率. 该方法充分利用了事件序列的有序特点,可用于发现各类频繁情节. 实验结果表明该算法性能优于Apriori-like频繁情节发现算法.  相似文献   

2.
发现频繁情节的改进算法   总被引:1,自引:0,他引:1  
在事件序列的数据挖掘中,一个重要的步骤就是发现频繁情节,一旦发现频繁情节就能导出描述该序列行为的情节规则.基于逐级(level-wise)搜索算法WINEPI,提出了一种发现频繁情节的改进算法.该算法通过一个新的引理,帮助进一步确定下一级中感兴趣的情节组合,从而获得了较高质量的候选集,缩短了执行时间,对实际数据和仿真数据的实验结果表明,本算法是有效的。  相似文献   

3.
数据流中一种有效的当前频繁序列挖掘方法   总被引:1,自引:0,他引:1  
给出了一种基于滑动窗口挖掘频繁序列算法。该算法给出了ε-近似序列集的定义,利用一种压缩的数据结构GSP-tree来存储和维护整个滑动窗口中各分区的近似序列集,并通过合并各分区的近似序列集来响应用户当前的查询请求。  相似文献   

4.
An efficient hybrid algorithm for mining Web frequent access patterns   总被引:1,自引:0,他引:1  
We propose an cfficienl hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP optimize its performance, which is using hash the to filter candidate set and trimming database. Whenever the database is trimmed to a size tess than a specified threshold, the algorithm puts the database into main memory By constructing a tree. and finds frequent patterns on the tree. The experiment shows that WDHP outperform algorithm DHP and main memory basedalgorithm WAP in execution efficieucy.  相似文献   

5.
关联规则最大频繁项目集的快速发现算法   总被引:7,自引:1,他引:7  
提出一种快速发现最大频繁项目集的算法, 该算法对集 合枚举树进行改进, 结合自底向上与自顶向下的搜索策略, 利用非频繁项目集对候选最大频 繁项目集进行剪枝和降维, 减少了不必要候选最大频繁项目集的数量, 显著提高了发现的效 率.  相似文献   

6.
研究事件序列中频繁情节的发现问题,提出了在事件序列中发现频繁并行情节的增量式算法。如果在事件序列中发现了频繁情节及其出现频率,就可以生成描述或预测该序列行为的情节规则。  相似文献   

7.
 在移动计算中挖掘满足用户需求的长频繁邻近类别集时,为了避免产生冗余候选项和减少重复计算量,提出一种基于幂集数递减的约束频繁邻近类别集挖掘算法,其能够提取包含约束条件的长频繁邻近类别集;该算法用幂集数递减序列来产生候选频繁邻近类别集,有效地删除了不满足用户需求的冗余候选项和减少了重复扫描空间实例的计算量.实验表明在挖掘满足用户需求的长频繁邻近类别集时,该算法比现有算法更快速.  相似文献   

8.
频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。  相似文献   

9.
针对应用射频识别(radio frequency identification,RFID)技术产生的海量数据,引入挖掘频繁路径的思想,提出挖掘频繁路径的算法MP(movement path)-mine.该算法通过构建MP-tree的形式,只须扫描数据库一次就可以挖掘出所有的频繁移动路径,便于快速向用户提供物品移动趋势方面的信息.理论分析和实验结果表明该算法性能非常有效.  相似文献   

10.
针对概率模体发现算法中非树形子图的挖掘和在得分函数最大化的过程中得分函数值计算的2个难点.首先提出基于划分的非树形子图的搜索算法,其次将子图同构应用于最小错配的求解以缩小智能优化算法对得分函数求解的解空间,最后将基于模拟退火算法和遗传算法的混合算法应用于得分函数的求解过程.在大肠杆菌基因调控网络中的实验结果表明,与其他算法相比,混合智能算法可以大大减少非树形子图的搜索时间,并以相对较快的收敛速度收敛到一个较优的解,因此所提出的方法有效地提高了概率模体发现的效率.  相似文献   

11.
针对Apriori算法需要多次扫描数据库以及可能产生庞大候选集的瓶颈问题,提出了一种改进的频繁项目集挖掘算法,该算法仅通过一次数据库的扫描生成一个链表,以比特位的方式存储项目在事物数据库中出现的位置,并在不产生候选集的基础上通过逻辑运算与集合运算的直接生成频繁项目集。经过实例分析,结果表明该算法相对于Apriori算法,能够在保证准确率的基础上拥有更低廉的代价。  相似文献   

12.
基于局部不变特征的图像匹配是三维场景重建的基础.本文使用SIFT特征,在LSH算法基础上,提出一种改进的高维数据搜索算法,较好地解决了图像的快速有效匹配问题.该算法提出一种改进的投影空间,使投影到新空间的高维数据特征的每一维比海明空间具有更高的局部敏感性,相比于经典的LSH、BBF、iDistance等高维搜索算法,本文算法可以获得更高的搜索精度和更快的搜索速度.  相似文献   

13.
基于集合运算的频繁集挖掘优化算法   总被引:1,自引:0,他引:1  
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。 提出了一种基于集合运算的频繁项目集挖掘算法,并将该算法与经典算法Apriori进行比较。该算法只需要对数据库扫描一遍。实验表明该算法的效率较好。  相似文献   

14.
提出一种最大频繁模式挖掘的改进算法(FP-Imax),该算法引入一种与FP-tree类似的结构MFI-tree来存储所有的最大频繁项目集,并采用有效的子集检查方法进行优化,降低了算法的时空开销,提高了挖掘效率。实验表明,与FP-Max相比该算法的挖掘速度快两2—3倍。  相似文献   

15.
使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性.  相似文献   

16.
为了有利于对网络用户实行个性化服务,采用先对服务器记录用户采用赋权值距离算法进行聚类,然后对各类缩小的用户群体采用BQ-tree树算法进行用户频繁浏览模式挖掘.仿真结果表明,整个算法在保证挖掘效果的同时,比以往的Apriori算法、FP-growth算法更节省时间,且挖掘结果能有效地对用户提供个性化服务.  相似文献   

17.
图书馆的不断数字化、个性化信息服务已经成为图书馆服务的一个热点问题,它改变了图书馆传统的被动服务方式,变被动服务为主动服务。首先介绍了数据挖掘与图书馆个性化信息服务的相关理论,进而介绍了数据挖掘技术在图书馆个性化信息服务中的应用,其次利用借阅记录分析了基于FP_tree的最大频繁模式挖掘算法,最后简要介绍了个性化信息服务系统设计过程。  相似文献   

18.
基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上.  相似文献   

19.
随着语义网概念的提出和电子商务的不断发展,模式匹配问题成为人们普遍关注的焦点.本文针对iMAP模式匹配系统文本检索器存在的不足,提出了一个改进的文本检索器检索策略,并根据定义的逻辑不匹配属性判定定理对搜索树进行过滤,实现了搜索树规模的降低,提高了候选匹配的检索效率.  相似文献   

20.
对既存在时间关系约束又存在时间宽度约束的n个事件,用时间规划的D_时刻表算法,可以求得2n个端点集的一个有序划分,该划分满足所有的约束条件.我们在应用中对算法进行了一些改进,增加了矩阵化简过程中的合并链和空事件,提高了算法的实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号