首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对基于Web日志挖掘的用户访问预测经典算法的不足,提出了基于Markov链和关联规则的预测算法(MAPA).使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;使用二项关联规则从正向和反向2个角度修正Markov的预测结果,从而生成最后的预测页面.通过引入用户反馈机制,提出了带反馈的Markov预测算法(MPAF),即在预测过程中逐步构造历史预测树,把历史预测信息保存到历史预测树中,并根据用户的反馈来判断预测的正确性.在预测过程中,用二阶Markov预测算法生成预测候选集,再利用历史预测信息动态地调整预测算法,从而生成预测页面.理论分析证明,这2种预测算法具有线性时间复杂度的预测效率.实验结果表明,MAPA和MPAF在预测准确率上平均提高5%和10%.  相似文献   

2.
关联规则和聚类分析在个性化推荐中的应用   总被引:12,自引:0,他引:12  
提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测度进行了比较·实验表明,将聚类分析作为关联规则的预处理的推荐方法可以显著地提高推荐的准确率,而将关联规则和聚类分析互补使用的推荐方法具有较高的推荐覆盖率·同时发现将聚类分析和关联规则结合使用并不能同时改善推荐的准确率和覆盖率·  相似文献   

3.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

4.
Web日志预处理中会话识别的优化   总被引:3,自引:0,他引:3  
针对目前的各种会话识别方法,提出了一种优化的会话切分方法.该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据.实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

5.
基于MAS的Web用户数据预处理   总被引:1,自引:2,他引:1  
数据预处理是采用基于Web的使用挖掘发现用户模式的第一步.由于Web用户数据来源的不同,不仅导致用户的识别困难,用户访问页面的完整性也难于得到保证,这给下一步的用户模式发现带来了问题.本文提出了一个基于MAS的数据预处理方法:在客户端采用Agent精确捕获用户浏览行为,构造用户访问图;在服务器端的Agent保存服务器生成页面,并根据客户端Agent返回的数据完整获得用户的访问内容,为有效实现用户模式发现提供了保证.  相似文献   

6.
通过Web日志挖掘技术可分析用户访问模式,从而为客户提供智能化、个性化服务。马尔可夫(Markov)模型的链式结构简便易行,适合作为一个预测模型来预测用户的页面访问模式。就此对Markov预测模型进行深入研究,描述了其实现算法,并结合实例对混合Markov预测模型方法进行了验证。  相似文献   

7.
本文研究了一种基于数据关联规则采集技术的用户个性化页面动态生成方案,此方案设计实现用户注册/登录、查询、购买;管理员对网站的系统管理;个性化页面动态生成——回显等程序模块;实现ASP和HTML页面,与现今网上已采用的一些方案相比,具有用户使用更简单、反映用户更明显细致等优点.  相似文献   

8.
利用关联分析来获取网页的使用情况,将下一个可能被用户发出请求预先发送到用户端。从另外一种角度解决现在网络普遍出现的拥挤问题,将数据挖掘技术中的关联规则与网络访问技术紧密地结合在一起,为提高网速开辟了一条新的途径。  相似文献   

9.
为在Web日志数据中挖掘关联规则以指导信息无障碍网站的设计与开发, 针对大量用户对网站页面URL(Uniform Resoure Locator)的访问频率等信息, 通过Apriori算法实
现数据挖掘, 以寻找用户访问页面之间的关联规则。根据3次点击原则及网站结构设计的特点, 对Apriori 算法网页超链接挖掘的过程进行了改进, 频繁项集最多只需找出所有3
-项集即可。算法实现过程表明, 该方法可有效降低算法的时间复杂度, 能通过对关联规则的分析确定用户感兴趣的网页类型, 找出用户所访问网页之间的链接关系。  相似文献   

10.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号