首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
宋宏明 《科技信息》2009,(16):176-177
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

2.
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

3.
在关联规则的挖掘过程中引入遗传算法,并且结合一个实例,给出了详细的利用遗传算法挖掘关联规则的实现方法。遗传算法的引入很好的避免了规则集中的"假规则"问题。同时,在算法的具体实现过程中,采用了截断赌轮、动态变异概率等方法,有效避免了遗传算法中早熟现象的发生。  相似文献   

4.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

5.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

6.
针对图书馆读者借阅信息复杂度过大的难点,采用遗传算法研究关联规则挖掘,并举例说明。  相似文献   

7.
根据关联规则挖掘的要求,结合遗传算法的特点,提出了一种基于遗传算法的关联规则挖掘算法,在基本遗传操作选择、交叉、变异的基础上,引入了挑选操作,取消了交叉、变异概率,给出了详细的算法设计及描述,并通过实例证明了算法的性能。  相似文献   

8.
本文对数据挖掘技术在Web日志文件中的挖掘应用进行了探讨,并对Web日志挖掘的意义、步骤、数据、准备以及算法进行了归纳,旨在帮助网站管理者更好的管理Web站点,用户更能方便的从Web站点获得服务,提高Web的使用效率.  相似文献   

9.
算法采用了一种新颖的质数编码方式,将数据库属性项压缩为一个数值型的项,把原来用字符串表示的记录转化为用一个合数表示,进而把字符串比较转化为数值运算.通过引入频繁项集估计数目,使算法总是在频繁项密集区进行挖掘,对搜索空间进行了有效修剪.实验表明,算法对数据库压缩比超过25%,效率至少能提高49%.  相似文献   

10.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

11.
 因特网上的数据越来越多、越来越复杂,这些异构、动态、分布的信息使得传统数据挖掘方式已经不能达到实际要求。本文提出了一种面向web 数据挖掘的改进型迭代算法,将迭代方法与多服务器并行算法进行结合,并采用该算法建立了一个支持并行关联规则的web 数据挖掘模型,融合存储节点本地计算的思想。实验证明,该模型能够提高web 数据挖掘的效率,并有随着数据量增加执行率升高的特点。  相似文献   

12.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

13.
对经典的基于距离的孤立点挖掘算法进行了改进,引入"关键属性",即减少了挖掘的数据量,从而提高了孤立点挖掘的效率,并且改进常用距离度量,用改进的加权曼式距离进行计算,降低了数据分布不均给检测结果带来的影响,同时改进后的挖掘算法在不影响挖掘结果的情况下取消了对参数设置的要求,给出了孤立点孤立的程度.  相似文献   

14.
关联规则Apriori算法自提出以来,有很多的改进算法,但大多是在改变最小支持度的大小,这样虽可提高Apriori算法的速度,但会漏掉一些有用的项集.本文结合以上问题,用一种科学的方法求出最小支持度,并在提取频繁项集的过程中动态地改变最小支持度的值,有效地解决了以上问题,提高了Apriori算法的效率.  相似文献   

15.
挖掘关联规则中Apriori算法的一种改进   总被引:3,自引:0,他引:3  
算法减少连接次数以及扫描数据库的次数从而缩短数据库扫描时间,利用项集有序性改进判断是否进行连接的策略,并利用标志位变化逐步消除无用事务,从而实现了事务压缩和项目压缩, 同时减少了判断时间。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。  相似文献   

16.
云计算环境下虚拟机的部署是有关资源管理、服务质量等方面的综合性问题,是一个多目标的NP-hard问题。根据弹性云环境下虚拟机部署的特点,利用遗传算法解决多目标组合优化问题的优点,提出一种基于改进遗传算法的虚拟机部署算法,以减少物理计算机开销、提高资源利用率、满足用户SLA为优化目标,将云计算环境下的资源管理和服务质量需求转化为算法可识别的信息,通过改进遗传算法,使之适应于静态和动态部署的要求。实验结果分析表明,该算法在满足多目标的条件下得到较优的解,为虚拟机到物理节点的映射提供了较好的解决方案。  相似文献   

17.
为了提高虹膜识别算法的有效性,提出了基于改进遗传算法进行特征选择的虹膜识别方法.针对虹膜图像纹理分布的特点,采用了多尺度环对称Gabor滤波器进行特征提取.同时,在特征选择上对经典遗传算法进行了改进,调整了遗传算法的交叉机制,提高了算法的搜索效率.为了检验算法的有效性,在中国科学院CASIA虹膜数据库上进行验证,实验结果表明该方法具有较高的识别精准度.  相似文献   

18.
为了避免陷入局部优化,提出使用混合遗传算法,即用应用模拟退火算法的Boltzmann生存方法,根据个体适应性的变异值Δf和概率值exp(-Δf/T),来保持个体的多样性,阻止提前收敛,用顺序交叉算子和部分路径翻转变异算子来提高算法的收敛速度,较好地解决了群体的多样性和收敛速度的矛盾.算法分析和测试表明,该改进算法是有效的.  相似文献   

19.
通过Apriori方法的分析,对web日志进行处理,并在此基础上提出了Apiori算法的一种快速优化方法,通过对实例的验证,证明该算法的有效性和正确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号