首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 656 毫秒
1.
现有的Web日志频繁访问路径挖掘算法往往不能在追求时间效率的同时准确挖掘出符合用户浏览顺序的频繁路径.提出了有效挖掘Web日志中频繁访问路径的算法,将事务数据库转换为Web访问路径树,根据支持度进行剪枝构造最长前缀频繁子路径树,然后进行频繁路径挖掘,实验证实了此方法的有效性,并分析了支持度设置对频繁路径生成的影响.  相似文献   

2.
针对界标模式的概要结构,提出一种挖掘物联网传感器频繁访问节点路径数据的新方法 MFAPIOTDL,通过在内存中构建Bit表,使算法可以单遍扫描数据集以获得有用模式。最后通过理论和实践测试算法的有效性。  相似文献   

3.
Web数据挖掘应用于电子商务系统,已成为数据挖掘热点研究.Web服务器日志中保存了大量的用户访问电子商务系统的记录,运用数据挖掘技术对数据进行处理和分析,构造频繁访问路径挖掘算法,获取用户的购物特性和习惯,达到向每个用户推荐产品的目的,进一步指导电子商务网站建设.  相似文献   

4.
大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难.该文提出一种分布式Web日志挖掘模型DWLMS,并以路径分析技术为例,提出了基于DWLMS的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性.  相似文献   

5.
有效的用户识别与用户细分是网站用户行为分析的基础.针对现有用户识别算法将注册用户和匿名用户均按匿名用户处理,导致用户分类不细致的问题,提出了一种匿名用户识别算法.该算法通过识别用户访问行为状态,采取页面访问路径和浏览时长匹配方式,进一步识别IP地址变化后混入纯匿名用户中的注册匿名用户,从而把用户细分为注册用户、假匿名用户和纯匿名用户.实验结果表明,该算法能够提高匿名用户识别率,更加准确地识别假匿名用户.  相似文献   

6.
针对NRA算法和BPA算法查询效率不高、重复访问数据的问题,提出了一种基于三维分档布鲁姆过滤器表(TF)的Top-k查询算法(TKBFP).该算法使用TF对数据进行处理,以较低的误判率获得较高的访问效率并降低了内存消耗,利用最优位置索引策略,避免重复访问数据对象.对TKBFP算法进行了严格的语义定义,推导出每一维BF中需要的哈希函数个数;以自主开发的Java程序为仿真平台,对TKBFP算法进行了试验,并对算法执行效率和存储性能进行评价.试验结果表明,该算法能够避免重复访问数据对象,并能以较低的误判率实现大规模数据的高效查询处理.与NRA和BPA相比,当属性列表超过4个时,开销明显降低,适合面向大规模数据的查询处理应用.  相似文献   

7.
考虑到Web访问数据的动态特性,给出了一个从Web访问日志历史演变中挖掘频繁波动的Web访问模式的方法.首先采用无序树结构表示用户历史访问页面序列集合,然后给出了频繁波动Web访问模式的详细定义以及挖掘算法描述,最后,根据数据集中访问序列的大小和数量变化对于算法扩展性和性能的影响进行了实验.结果表明,该算法具备良好扩展性的同时,能够比较高效地提取出频繁波动的Web访问模式.  相似文献   

8.
针对数据挖掘在网络游戏中的应用,提出了游戏访问模式挖掘的概念,并给出一种适用于挖掘游戏访问模式的Apriori_Trie_GAPM算法.该算法基于Apriori算法思想,采用Trie树生成并存储频繁项集,在支持度计算中结合了游戏使用时间.  相似文献   

9.
在CNC加工中,刀具运动轨迹的插补算法是一个重要的技术问题。对此,介绍了一种轨迹跟踪算法,即用几何属性定义轨迹,通过重复应用双可析执行结构来生成在要求路径(偏移)上一系列连续的点;该算法能适应要求路径的可析表达式是可得的情况,它能保证最大一步轨迹位置的误差。  相似文献   

10.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣,这种兴趣程度可以通过用户对Web站点上页面的浏览顺序及页面上的浏览时间表现出来.通过对Web用户访问路径的分析,提出一种基于浏览路径及浏览时间的相似度的度量方法.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader聚类算法Web用户的有效性.  相似文献   

11.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

12.
用户浏览偏爱模式挖掘算法的研究   总被引:2,自引:0,他引:2  
针对当前的挖掘算法只是简单地把频繁访问路径作为用户浏览的兴趣路径的问题,充分地考虑了用户在页面上的浏览时间和在路径选择上表现出来的浏览偏爱,提出了基于远程代理数据收集的浏览偏爱模式挖掘算法。该算法先利用客户端的远程代理收集用户浏览信息,然后划分成用户事务,最后利用一个递归过程找出用户浏览偏爱模式。实验证明:该算法比当前的频繁访问路径算法在用户浏览兴趣度量上更准确。  相似文献   

13.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

14.
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。  相似文献   

15.
一种基于喷泉码和并行路径的深空通信无反馈协议   总被引:1,自引:0,他引:1  
针对深空通信延时非常大的特点,提出了一种基于喷泉编码和并行路径的无反馈数据传输协议,该协议能够避免发送端和接收端之间反复的握手过程,缩短数据传输时间.同时通过在发送端和接收端之间部署多个中继,建立并行传输路径保证数据能够连续传输,克服单一路径易受链路中断影响的缺点,达到充分利用链路资源的效果.仿真结果表明,只要采用编码开销比链路丢包率稍微大一点的喷泉码就能保证数据在接收端以极高的概率准确恢复;增加并行传输路径的数目可以提高传输容量,减小传输所用时间.  相似文献   

16.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

17.
 提出了满足DTD结构情况下XML查询语句中频繁路径的选择算法,即从大量的XML查询路径表达式中找出最频繁出现的路径.首先对XML查询语句进行离散化处理,然后基于不产生候选集的频繁模式挖掘算法,实现了XML频繁查询路径的选择,最后基于DTD结构重构包含频繁路径的XML查询.实验研究表明,所提出方法具有一定的有效性及合理性.  相似文献   

18.
随着网络信息技术的高速发展,图书馆的信息采集、组织、保存以及服务方式都发生了改变,用户利用信息的习惯也得到改变。只有加强图书馆员的继续教育,才能提升图书馆的服务质量。在阐述图书馆员继续教育意义的基础上,结合国内外有关图书馆员继续教育的研究状况,探讨了图书馆员继续教育的途径。  相似文献   

19.
针对应用射频识别(radio frequency identification,RFID)技术产生的海量数据,引入挖掘频繁路径的思想,提出挖掘频繁路径的算法MP(movement path)-mine.该算法通过构建MP-tree的形式,只须扫描数据库一次就可以挖掘出所有的频繁移动路径,便于快速向用户提供物品移动趋势方面的信息.理论分析和实验结果表明该算法性能非常有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号