首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
针对用户的日常移动轨迹进行挖掘,可以有效地发现隐藏在用户生活中频繁出现的移动规律,即用户频繁移动模式,提出了一种基于PrefixSpan算法的用户频繁移动模式并行挖掘算法PASFORM.该算法利用了新的剪枝策略,缩小了搜索空间;引入了时间约束,挖掘出的频繁移动模式带有时间属性;使用前缀树存储频繁移动模式,缩小了存储空间;采用了并行化方法,适用于海量时空数据的挖掘.实验结果表明,该方法能够快速有效地挖掘出用户频繁移动模式.  相似文献   

2.
为了有效地挖掘物流管理系统中的物流频繁路径序列模式,提出了一种针对物流数据分析的路径序列挖掘算法ImGSP算法.ImGSP算法通过对原始路径数据库筛选,选出路径序列长度大于或等于候选序列长度的路径序列,有针对性地产生过度候选序列,来约减候选序列.实验结果表明:ImGSP算法能够有效地减少候选序列数量,生成频繁路径序列模式,进而产生物流中有用的规则.该方法不仅缩小了扫描数据库的规模,而且减少了生成频繁序列的候选序列集合.  相似文献   

3.
针对传感器网络中包括目标位置和时间的二维属性频繁移动模式挖掘问题,建立了一种新的树状结构OMP-tree,OMP-tree可以压缩存储大量的原始移动模式.同时提出了一种条件搜索算法,使用该算法可以大大减少满足条件的前缀模式数量.基于OMP-tree和条件搜索算法,设计了一种新的挖掘目标的频繁移动模式算法OMP-mine.该算法基于模式增长思想,直接递归地从条件模式基中得到频繁的前缀模式,然后连接后缀,达到模式增长的目的.仿真结果表明,OMP-mine算法可以有效挖掘出传感器网络中具有二维属性的频繁移动模式,并较好地降低了算法的时间和空间复杂度.  相似文献   

4.
现有的Web日志频繁访问路径挖掘算法往往不能在追求时间效率的同时准确挖掘出符合用户浏览顺序的频繁路径.提出了有效挖掘Web日志中频繁访问路径的算法,将事务数据库转换为Web访问路径树,根据支持度进行剪枝构造最长前缀频繁子路径树,然后进行频繁路径挖掘,实验证实了此方法的有效性,并分析了支持度设置对频繁路径生成的影响.  相似文献   

5.
提出了一种从Web日志中快速挖掘连续可重复频繁访问路径的新算法ICAP.该算法通过构造以频繁项目p为根的SAP树,能一次挖掘出所有以p为前缀的连续可重复频繁访问路径.最后通过实验验证了算法的正确性和有效性.  相似文献   

6.
Web日志中挖掘用户浏览模式的研究   总被引:24,自引:0,他引:24  
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。  相似文献   

7.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

8.
 在移动计算中挖掘满足用户需求的长频繁邻近类别集时,为了避免产生冗余候选项和减少重复计算量,提出一种基于幂集数递减的约束频繁邻近类别集挖掘算法,其能够提取包含约束条件的长频繁邻近类别集;该算法用幂集数递减序列来产生候选频繁邻近类别集,有效地删除了不满足用户需求的冗余候选项和减少了重复扫描空间实例的计算量.实验表明在挖掘满足用户需求的长频繁邻近类别集时,该算法比现有算法更快速.  相似文献   

9.
设计了一种不同于传统关联规则挖掘算法(如Apriori算法等)频繁项集产生算法.该算法借鉴一般免疫算法思想,并从新的角度来看频繁项集的定义,避免了传统算法中存在的"项集生成瓶颈"问题.通过对mushroom数据的频繁项集挖掘的实验,与传统方法进行了比较,其结果表明,基于免疫算法的频繁项集挖掘算法在大数据集、低支持度情况下平均挖掘时间短.  相似文献   

10.
通过对Apriori算法的频繁项目集的分析研究,给出了基于图的频繁项集挖掘算法.该算法在求频繁K-项集的过程中只需一次扫描数据库,避免了Apriori算法需多次扫描数据库的不足.同时,由于在有向图中利用有限节点之间的路径求频繁K-项集,该算法减少了Apriori算法中需多次进行连接运算的不足.  相似文献   

11.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

12.
 提出了满足DTD结构情况下XML查询语句中频繁路径的选择算法,即从大量的XML查询路径表达式中找出最频繁出现的路径.首先对XML查询语句进行离散化处理,然后基于不产生候选集的频繁模式挖掘算法,实现了XML频繁查询路径的选择,最后基于DTD结构重构包含频繁路径的XML查询.实验研究表明,所提出方法具有一定的有效性及合理性.  相似文献   

13.
用户浏览偏爱模式挖掘算法的研究   总被引:2,自引:0,他引:2  
针对当前的挖掘算法只是简单地把频繁访问路径作为用户浏览的兴趣路径的问题,充分地考虑了用户在页面上的浏览时间和在路径选择上表现出来的浏览偏爱,提出了基于远程代理数据收集的浏览偏爱模式挖掘算法。该算法先利用客户端的远程代理收集用户浏览信息,然后划分成用户事务,最后利用一个递归过程找出用户浏览偏爱模式。实验证明:该算法比当前的频繁访问路径算法在用户浏览兴趣度量上更准确。  相似文献   

14.
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。  相似文献   

15.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

16.
分布式全局频繁项目集的快速挖掘方法   总被引:8,自引:1,他引:8  
针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,每个节点只保留指向父结点的指针,减少了指针数,由此可节省1/3的树空间;同时通过传送用3个很小的数组表示的被约束子树,在此挖掘全局频繁项目集的过程中不再生成大量候选项目集或条件FP-树,从而减小了网络通信量,提高了挖掘效率.实验表明,所提算法的挖掘速度比传统的分布式数据库数据挖掘算法至少提高了1倍之多,随着数据库规模的增大,它的扩展性将更好.  相似文献   

17.
有效地进行频繁项挖掘一直以来都是数据挖掘任务中最为重要的组成部分。已有的大部分频繁项挖掘算法在数据项多及支持度低的情况下,算法的效率急剧下降。为了有效地解决此类问题,提出了一种采用双向十字链表结构的频繁项挖掘算法(two-way crossed list for frequent itemsets mining,TCLFI)。极大地降低了搜索空间,加快了频繁项的筛选过程,减少了所需保存的数据项个数,从而降低了时间复杂度,提高了频繁项的挖掘效率。实验通过真实数据集和合成数据集验证了算法的有效性和扩展性。  相似文献   

18.
在分析类Apriori算法存在效率瓶颈的基础上,提出了一个高效改进算法——基于分类树的关联规则挖掘算法.该算法只需要两次访问数据库,把数据库中的数据利用分类树来存储,减少了访问数据库的次数;并且由分类树的全部或部分来求得频繁项目集,减少了求频繁项目集的比较次数.此算法通过结合Apriori和FP—tree两种算法来提高挖掘效率,降低了挖掘算法的时间复杂度和空间复杂度.通过多次试验证明该算法比Apriori及其改良算法的挖掘效率高2到8倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号