首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
Web日志中挖掘用户浏览模式的研究   总被引:24,自引:0,他引:24  
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。  相似文献   

2.
现有的Web日志频繁访问路径挖掘算法往往不能在追求时间效率的同时准确挖掘出符合用户浏览顺序的频繁路径.提出了有效挖掘Web日志中频繁访问路径的算法,将事务数据库转换为Web访问路径树,根据支持度进行剪枝构造最长前缀频繁子路径树,然后进行频繁路径挖掘,实验证实了此方法的有效性,并分析了支持度设置对频繁路径生成的影响.  相似文献   

3.
为了分析网络用户的浏览行为特征,实现科学平台的网络个性化服务,用广义频繁子序列挖掘算法,该算法挖掘Web服务器日志中的用户浏览路径,设计科学平台用户的浏览模式,为用户提供主动式信息服务.经过对日志文件的预处理,得到用户会话文件,然后采用广义频繁子序列挖掘算法对用户浏览模式进行识别.实际应用表明,这种广义频繁子序列识别方法能够有效地发现用户的兴趣所在,从而更好地为用户在线浏览提供帮助.  相似文献   

4.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

5.
将Web使用挖掘应用到网络教育领域,分析了其挖掘过程,包括数据采集、数据预处理、模式发现和模式分析;通过建立网络教育资源导航模型,并利用蚁群算法对Web日志数据中使用者的浏览行为进行挖掘;提出一个新的导航路径挖掘算法,可以发现有价值的用户浏览模式,指导用户对教育资源作进一步的搜索,还可以将训练好的网络图用于用户的个性化定制服务。  相似文献   

6.
考虑到Web访问数据的动态特性,给出了一个从Web访问日志历史演变中挖掘频繁波动的Web访问模式的方法.首先采用无序树结构表示用户历史访问页面序列集合,然后给出了频繁波动Web访问模式的详细定义以及挖掘算法描述,最后,根据数据集中访问序列的大小和数量变化对于算法扩展性和性能的影响进行了实验.结果表明,该算法具备良好扩展性的同时,能够比较高效地提取出频繁波动的Web访问模式.  相似文献   

7.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

8.
本文讨论了基于Web使用挖掘的Web个性化技术,针对个性化系统的功能及特点,论述了相关数据采集、数据预处理技术和模式发现及其在个性化服务中的应用,提出了一个关于个性化系统的实时聚类算法.实验结果表明,该算法不仅有效,而且具有较高的准确度,能适应用户短期浏览的变化.  相似文献   

9.
Web用户模式     
根据用户的浏览操作,对用户相似的浏览过程提出了一个基于文档关键词的聚类算法,进而生成了Web个性化的用户模式,它能帮助Web用户从搜索引擎所返回的大量文档中筛选出自己所需要的文档,从而提高用户信息检索的准确性和效率。  相似文献   

10.
通过对Web内容挖掘、Web结构挖掘、Web使用记录挖掘的研究和分析,探讨了利用Web Services技术实现三者之间的集成,并在此基础上提出了基于Web Services的Web挖掘集成的实现方案.方案的实施,可以更容易地获得各种Web信息进而对其进行分析,从而发现潜在用户,改进站点设计,方便客户浏览和交易.  相似文献   

11.
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。  相似文献   

12.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

13.
网页链接关系的设计影响到用户的访问效率,通过日志挖掘发现网页间的关联关系,使网站设计更趋合理,便于用户访问.为了提取页面间的关系,日志数据预处理后,利用Apriori算法发现频繁集,找到页面间的关联规则.网站结构主要由网页和网页间的超链接组成,针对网页超链接结构的特点:一条超链接只能建立在两个网页上.发现频繁集只需找出所有2-项集即可.提出网页超链接挖掘的Apriori改进算法(WPHM-Apriori).实验表明,该算法有效地降低Apriori的时间复杂度.  相似文献   

14.
传统的关联规则Apriori算法中,只要两个k-1维的频繁项集有k-2个元素相同就可以生成维数为k的候选集,但在利用Web访问信息挖掘用户浏览模式发现频繁路径时,效率比较低下,本文利用Apriori算法的思想,对其进行了改进,进行频繁路径挖掘。  相似文献   

15.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

16.
Web日志挖掘改进网站结构的研究   总被引:1,自引:0,他引:1  
Web日志挖掘是目前Web挖掘研究的一个热点课题.针对Web日志挖掘中存在的问题,研究和分析了一个基于网站访问矩阵的路径挖掘算法.在此基础上设计和实现了一个Web日志挖掘系统(WLMS),通过发现用户访问的最优路径和网站访问的统计结果,改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

17.
Web上用户行为的挖掘是Web日志挖掘的重要内容,挖掘到的查找路径能够提供决策支持。分析频繁项集挖掘和路径挖掘的不同之处,提出了类Apriori算法,使之适用于路径挖掘,然后在VC++中针对预处理过的日志数据进行实验分析,获得了一些可信度高的关联页面,这些页面关联信息将有助于改进商业站点结构,提高站点的访问率。  相似文献   

18.
提出了一种从Web日志中快速挖掘连续可重复频繁访问路径的新算法ICAP.该算法通过构造以频繁项目p为根的SAP树,能一次挖掘出所有以p为前缀的连续可重复频繁访问路径.最后通过实验验证了算法的正确性和有效性.  相似文献   

19.
自适应Web站点站能够根据用户需要快速灵活地改变自身,动态适应不断变化的用户需求和应用环境.通过Web日志文件的挖掘,找出用户的访问模式,及该模式中的访问类型,而且分析当前访问页面的频繁度后,形成经过内容裁剪的个性化页面来压缩Web页面内容.在此基础上,设计了一个自适应站点模型,改善Web站点的结构和组织形式以使站点达到更好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号