首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 64 毫秒
1.
通过Apriori方法的分析,对Web日志进行处理,并在此基础上提出了Apiori算法的一种快速优化方法,通过对实例的验证,证明该算法的有效性和正确性.  相似文献   

2.
基于web数据挖掘的Apriori算法及其优化算法研究   总被引:1,自引:0,他引:1  
从数据挖掘中的关联规则概念入手,介绍了关联规则挖掘中的核心算法Apriori实现过程,针对出现的瓶颈又介绍了几种Apriori算法的优化方法,最后指出了末来关联规则挖掘算法的研究方向.  相似文献   

3.
利用Apriori算法对Deep Web网站中最大频繁关联关系网页进行识别,并对非最大频繁项网页进行剪枝,再遍历Deep Web网站网页,从而获取所有最大频繁关联关系网页。对某房地产Deep Web网站的实验结果验证了该算法的可行性和有效性。  相似文献   

4.
分析了Apriori算法存在之不足,在此基础上提出了一种基于分区思想的IABP算法.该算法首先将待挖掘的数据集分成若干块,然后分别对各块进行挖掘.在挖掘过程中,只存储满足最小支持度的频繁项,并删除不满足最小支持度的非频繁项.测试结果表明,该挖掘方法降低了挖掘算法的时闻复杂度,提高了挖掘算法的效率.  相似文献   

5.
基于云计算的Apriori算法设计   总被引:1,自引:0,他引:1  
对云计算技术和数据挖掘进行研究,分析Apriori算法,针对其局限性,提出优化方案,引入云计算中MapReduce模型,实现并行化。提出一种基于MapReduce的频繁项集挖掘方法,以提高算法的运行效率,降低算法执行所需的开销。  相似文献   

6.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

7.
由于传统的Apriori算法是串行的并且效率较低,分析了Apriori算法的计算过程,针对其原理设计了一种基于Mapreduce的并行Apriori改进算法.实验结果证明,改进的算法能较好地提高关联规则挖掘的效率,具有接近线性的加速比和良好的应用价值.  相似文献   

8.
关联规则挖掘是数据挖掘中的研究的一个非常重要的分支,主要用于发现隐藏在数据库中数据的联系和一些有趣的规律。本文给出了关联规则概念及相关术语的定义,并阐述了关联规则Apriori算法以及对Apriori算法进行了举例与性能分析。  相似文献   

9.
黄燕 《当代地方科技》2009,(11):163-164
本文利用Apriori算法对图书管理集成系统产生的流通数据进行数据挖掘,找出读者借阅书目之间的关联规则,从而指导图书馆工作人员主动的向读者推荐满意的图书。  相似文献   

10.
在一个竞争的环境下,客户关系对企业而言是至关重要的。提供客户所需要的,满意的个性化服务,是客户关系管理的主要内容。Apriori算法作为主要的数据挖掘算法之一在客户关系管理中得以广泛应用,本文主要介绍了Apriori算法含义及其相关概念,着重研究了该算法的实现及其在实际的客户关系管理系统中是如何运用的,对客户关系管理系统的开发和实现具有现实意义。  相似文献   

11.
针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。  相似文献   

12.
本文讨论了基于Web使用挖掘的Web个性化技术,针对个性化系统的功能及特点,论述了相关数据采集、数据预处理技术和模式发现及其在个性化服务中的应用,提出了一个关于个性化系统的实时聚类算法.实验结果表明,该算法不仅有效,而且具有较高的准确度,能适应用户短期浏览的变化.  相似文献   

13.
首先描述了数据开采,及Web数据挖掘,最后提出了Web数据挖掘的发展方向和趋势。  相似文献   

14.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用.  相似文献   

15.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

16.
0 IntroductionThe useful texts information in the Web is analyzed bythe method of Web information retrieval according tothe requirement of the user . To get the information of citingtexts and relative key words fromthe Web,we can searchforlots of correlativeinformation data storedinthe Web databaseby Webinformationretrieval .This paper appliedthe method-ology of data mining to Web information retrieval since thepurpose of data miningisto discover thefrequent patternfromthe Web.Alot of studi…  相似文献   

17.
提出了一种重构网站结构的方法,并将此方法应用于Web日志挖掘的数据预处理中.实验表明,本方法能够更好地还原用户访问情景,为Web日志挖掘提供有效数据。  相似文献   

18.
In this paper, an improved algorithm, named STC-I. is proposed for Chinese Web page clustering based on Chinese language characteristics, which adopts a new unit choice principle and a novel suffix tree construction policy. The experimental results show that the new algorithm keeps advantages of STC, and is better than STC in precision and speed when they are used to cluster Chinese Web page.  相似文献   

19.
Web用户访问模式挖掘   总被引:3,自引:0,他引:3  
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号