首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
Web序列模式挖掘是将数据挖掘技术应用于Web访问序列,通过对Web访问序列的模式挖掘可以发现用户与网站交互的频繁模式,利用这些模式可以建模并分析用户与网站交互的模型,进而预测未来的访问模式,这对于构建智能化Web站点和开展电子商务活动有非常重要的意义.介绍了传统的PLWAP(position coded preorder linked WAPtree)算法,并在此基础上提出了一种对PLWAP算法中Header table的新的构建方法的改进算法(NPLWAP).在NPL-WAP算法中Header table的构建过程中每一步都只基于当前处理的节点的后缀树集,且Header table并不存储所有的后缀树集节点,而是只存储后缀树集根节点,从而减少挖掘过程的相关判断.通过对真实数据的实验对比可以看出NPLWAP算法在运行时间上比传统的PLWAP算法有了很大的改进.  相似文献   

2.
一种从Web日志中挖掘访问模式的新算法   总被引:5,自引:0,他引:5  
提出了一种用于从Web日志中高效挖掘Web访问模式的新算法.设计了一个新的数据结构WAS树(Web Access Sequence树)来记录Web访问序列和它的计数,避免冗长的支持度计算;开发出一个高效的递归算法,从WAS树中枚举出所有的访问模式,最后对算法的性能进行了分析并给出试验数据加以佐证.这个算法的特点是不需要产生候选模式而直接挖掘出所有的访问模式。  相似文献   

3.
大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难.该文提出一种分布式Web日志挖掘模型DWLMS,并以路径分析技术为例,提出了基于DWLMS的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性.  相似文献   

4.
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。  相似文献   

5.
在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基于server session的约束概念,利用其能够减少初始序列模式和候选项集大小的特点来减少每次扫描后缀数据库的规模,再从预处理后的日志文件中挖掘WUM的频繁访问路径的序列模式.最后通过实验证明了算法的有效性和优越性.  相似文献   

6.
Web用户访问模式挖掘   总被引:3,自引:0,他引:3  
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述.  相似文献   

7.
介绍了数据挖掘、网络挖掘和网络用法挖掘技术的理论发展及其它们在实际中的应用情况,并在挖掘算法的改善提高过程中进行了探索性的研究.为了有效地帮助Web站点管理员管理Web站点,帮助商家调整整个市场策略,提出了一种在给定的Web日志中利用事务数据库中的挖掘序列模式的方法来发现所有的大访问路径的算法.结果证明该算法是行之有效的.  相似文献   

8.
首先介绍了Web数据挖掘的概念及常见的三种web数据挖掘模式Web内容挖掘、Web结构挖掘、Web访问挖掘,然后Web数据挖掘在个性化网络学习中的应用空间分两个方面进行分析.  相似文献   

9.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

10.
Web日志中挖掘用户浏览模式的研究   总被引:24,自引:0,他引:24  
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。  相似文献   

11.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用.  相似文献   

12.
Web数据挖掘技术初探   总被引:1,自引:1,他引:0  
Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。讨论Web数据挖掘技术中各种类型的Web数据挖掘的基本过程以及它们所使用的一些相关技术,分析Web数据挖掘的特点及面临的挑战.  相似文献   

13.
一种有效的Web使用挖掘体系结构   总被引:1,自引:1,他引:1  
对Web挖掘的特征、分类及与其相关的技术和工具进行了分析,针对现有的Web使用挖掘研究中缺乏统一而有效的结构模型的问题,提出了一种有效的Web使用挖掘的体系结构,并详细地分析了利用该结构模型处理Web使用挖掘的过程,最后,利用某大学网站的Web日志数据验证了该结构的有效性.  相似文献   

14.
Web挖掘技术   总被引:7,自引:1,他引:7  
万维网的出现使计算机拥有海量的信息资源 ,而其中蕴含的知识却未能得到充分利用。为此 ,Web挖掘技术成为一项重要研究课题。文中对Web挖掘分类、与Web挖掘相关的各种技术以及Web挖掘应用加以阐述。最后提出了一个综合Web挖掘原型系统SWMS。  相似文献   

15.
首先描述了数据开采,及Web数据挖掘,最后提出了Web数据挖掘的发展方向和趋势。  相似文献   

16.
通过Apriori方法的分析,对web日志进行处理,并在此基础上提出了Apiori算法的一种快速优化方法,通过对实例的验证,证明该算法的有效性和正确性。  相似文献   

17.
Web文本挖掘研究   总被引:4,自引:0,他引:4  
介绍Web文本的概念、一般过程和挖掘的关键技术,为智能化Web奠定一定基础。  相似文献   

18.
基于XML的Web数据挖掘   总被引:4,自引:0,他引:4  
介绍了数据挖掘、Web数据挖掘以及XML的基础知识,阐述了将XML技术应用于Web数据挖掘,构建基于XML的Web数据挖掘系统结构.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号