首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
协作过滤是当今应用较为成功的个性化服务技术,Web日志可以为个性化服务技术提供重要的数据源,只要对日志数据进行高效预处理,就能提高协作过滤算法有效性和个性化服务质量。结合实际日志数据的处理,给出了基于协作过滤的Web日志数据预处理过程结构图和一种可行的数据预处理方法,该方法不仅可以提供更加干净、规则的数据源,而且在用户兴趣度量方面,弥补了以往诸多兴趣度量方法的不足,为协作过滤算法提供了更加准确的数据支持。  相似文献   

2.
Web日志挖掘中数据预处理技术研究   总被引:2,自引:0,他引:2  
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。  相似文献   

3.
Web日志挖掘中的数据预处理技术   总被引:5,自引:0,他引:5  
用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统.  相似文献   

4.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

5.
基于Web日志的因特网协作推荐系统的研究   总被引:2,自引:0,他引:2  
针对当前推荐系统研究中存在的问题,提出了一个基于Web日志的Internet协作推荐系统。它在用户浏览兴趣度量时综合考虑了页面访问次数、浏览时间的长度和页面的大小,然后将具有相似用户浏览兴趣的页面进行推荐。算法过程如下:先对Web日志进行预处理后得到用户事务,然后对这些用户事务进行各个页面的浏览兴趣矢量表示,最后通过推荐引擎生成实时推荐。经实验表明,该系统比其他方法推荐的网页点击率高。  相似文献   

6.
W eb日志挖掘是将数据挖掘技术应用到W eb服务器的日志中,发现web用户的行为模式.在介绍了典型的数据预处理技术的基础之上,指出Fram e页面降低了挖掘结果的兴趣性,并提出相应的解决方法-Fram e页面过滤算法消除其影响.通过实验数据对该算法进行验证,说明Fram e页面过滤算法可以显著地提高W eb日志挖掘结果的兴趣性.  相似文献   

7.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

8.
研究了面向用户兴趣的Web信息过滤系统的主要技术,包括用户兴趣表示、度量和更新、网页内容识别和网页信息过滤等技术,并在此基础上设计和实现了一个Web信息过滤系统。该系统能够进行一定的信息过滤,能够进行自学习,并随着用户兴趣的变化渐渐更新,基本能够实现用户的个性化信息服务需求。  相似文献   

9.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

10.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

11.
针对传统协同过滤算法难以解决数据稀疏性、冷启动及用户兴趣各异的问题,提出了基于加权二部图的个性化推荐方法,解决个性化设计方案推荐问题。采用加权二部图,基于用户特征和方案特征的评分,对用户和方案分类,减轻数据稀疏性,形成用户-方案规则库;采用加权网络的协同过滤算法,计算新用户特征与用户-方案规则库中用户特征的改进相似度,通过Top-N方法筛选高相似的方案集进行推荐,解决冷启动和用户兴趣各异的问题。最后与传统协同过滤算法、加权二部图个性化推荐进行比较,证明该方法的有效性和实用性。  相似文献   

12.
通过分析现有的协作过滤技术,提出了基于矩阵聚类的协作过滤算法,把矩阵聚类算法和协作过滤相结合,自动划分原始用户———资源评分矩阵,依据划分后的子数据矩阵生成推荐结果.实验结果表明,提出的基于矩阵聚类的协作过滤算法优于传统协作过滤算法,减少了近邻搜索范围,提高了算法的推荐精度.  相似文献   

13.
协同过滤技术被成功地应用于个性化推荐系统中,但随着系统规模的扩大,它不能真实地反映用户的兴趣偏好.针对此缺点,提出了一种新的协同过滤推荐算法,该算法根据用户偏好序列的相似性来搜索目标用户的最近邻居和产生推荐,从而有效地解决了传统协同过滤推荐中过分依赖不能真实反映用户兴趣偏好的用户等级评价的问题,改进了传统协同过滤算法中计算邻居用户的方法.实验结果表明,该算法在个性化推荐系统应用中取得了较好的推荐效果和推荐质量.  相似文献   

14.
Personalized service systems are an effective way to help users obtain recommendations for unseen items, within the enormous volume of information available based on their preferences. The most commonly used personalized service system methods are collaborative filtering, content-based filtering, and hybrid filtering. Unfortunately, each method has its drawbacks. This paper proposes a new method which unified partition-based collaborative filtering and meta-information filtering. In partition-based collaborative filtering the user-item rating matrix can be partitioned into low-dimensional dense matrices using a matrix clustering algorithm. Recommendations are generated based on these low-dimensional matrices. Additionally, the very low ratings problem can be solved using meta-information filtering. The unified method is applied to a digital resource management system. The experimental results show the high efficiency and good performance of the new approach.  相似文献   

15.
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品.  相似文献   

16.
随着电子商务的发展状大,缺乏个性化服务成为制约电子商务发展的关键问题。基于web数据挖掘的电子商务推荐系统可以满足电子商务未来发展趋势的需要。本文以一组数据为实例阐述了基于web数据挖掘的协同过滤推荐算法是如何进行数据表示、近邻查询以及推荐产生这三个阶段的有效实施的。  相似文献   

17.
在基于物品协同过滤的基础上,对隐式反馈数据进行挖掘建模,设计了隐式反馈偏好评分规则,并据此赋予了计算酒店相似度公式的新定义。考虑到用户的基本特征也会对用户个性化需求产生影响以及单一算法的局限性,进一步引入了XGBoost模型,利用XGBoost训练对改进后的推荐结果进行过滤,得到较好的个性化酒店推荐系统。文中采用真实的脱敏数据,证明利用层叠模型构建个性化酒店推荐系统的推荐效果更加精准,对于酒店在线平台的个性化服务具有较强的参考价值。  相似文献   

18.
基于两阶段聚类的协作过滤推荐算法   总被引:1,自引:0,他引:1  
协作过滤推荐是目前主流的个性化推荐方式,但数据稀疏问题影响了推荐系统的性能.提出了基于两阶段聚类的协作推荐算法,降低了数据的稀疏性,提高了最近邻的准确度,而且推荐精度较以往传统的算法有明显提高,时间复杂度也有明显降低.  相似文献   

19.
针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(k-nearest neighbor algorithm,KNN)个性化邮件过滤方法.该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号