首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 811 毫秒
1.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

2.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

3.
针对Web对象激增导致网站层次结构复杂难辨的问题,提出一种基于页面聚类的Web概念化建模方法。首先基于用户访问路径建立Web层次结构模型(WHM),然后依据页面相似度对位于同一层次的页面进行聚类,得到Web概念化模型(WCM),最后将该模型应用于Web预取系统。实验结果表明,WCM模型在保持较高预取效率的前提下具有较好的聚类效果和适用性。  相似文献   

4.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

5.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣,这种兴趣程度可以通过用户对Web站点上页面的浏览顺序及页面上的浏览时间表现出来.通过对Web用户访问路径的分析,提出一种基于浏览路径及浏览时间的相似度的度量方法.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader聚类算法Web用户的有效性.  相似文献   

6.
该文提出一个基于Web日志的用户和URL聚类的快速算法。利用用户浏览行为建立用户事务矩阵,在此基础上综合考虑用户浏览时间以及点击频率来获取用户权值和页面权值,构建带权值的模糊聚类。为了缩小运算量,构造等价事务,进行事务约减:并针对于FCM算法簇数目初始化敏感的问题,提出了一种全局搜索的方法,搜寻最优的类中心数。实验证实,该算法在精度和效率上都获得了大大提高。  相似文献   

7.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

8.
一种新的Web事务模糊聚类算法的研究   总被引:11,自引:1,他引:11  
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。  相似文献   

9.
对Web日志进行有效聚类,可得到网站不同访问群和访问模式,研究了Web用户群模糊聚类关键技术.因为Web数据既有定量属性,又有定性属性,对Web用户群的聚类挖掘采用了模糊聚类方法,并设计了基于用户群的页面推荐函数.试验证明,Web用户群模糊聚类挖掘方法是有效的.  相似文献   

10.
基于Web日志的因特网协作推荐系统的研究   总被引:2,自引:0,他引:2  
针对当前推荐系统研究中存在的问题,提出了一个基于Web日志的Internet协作推荐系统。它在用户浏览兴趣度量时综合考虑了页面访问次数、浏览时间的长度和页面的大小,然后将具有相似用户浏览兴趣的页面进行推荐。算法过程如下:先对Web日志进行预处理后得到用户事务,然后对这些用户事务进行各个页面的浏览兴趣矢量表示,最后通过推荐引擎生成实时推荐。经实验表明,该系统比其他方法推荐的网页点击率高。  相似文献   

11.
一种基于后缀树的中文网页层次聚类方法   总被引:1,自引:3,他引:1  
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比。聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。  相似文献   

12.
采用路径划分聚类算法,对Web用户访问路径进行划分,然后根据其相似度进行聚类,依据分类系数和平均模糊熵来判定簇个数的最优解,得到较好的聚类效果,为最终挖掘出用户的访问模式奠定了良好的基础.实验发现簇中心偏移次数明显减少,中心长度有所提高,证明算法具有较好的效率.  相似文献   

13.
基于超图聚类的用户行为模式挖掘   总被引:2,自引:1,他引:2  
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。  相似文献   

14.
根据用户行为模式自动生成动态链接的方法   总被引:2,自引:0,他引:2  
分析了面向用户行为来进行网页动态链的思想方法.提出了处理用户访问网站的日志数据方法,并提出聚类用户的算法思想与步骤,最后分析了每组用户动态生成每组喜欢的链接思想与算法.主要介绍如何预处理用户日志访问数据及对用户聚类.  相似文献   

15.
通过Web日志挖掘技术可分析用户访问模式,从而为客户提供智能化、个性化服务。马尔可夫(Markov)模型的链式结构简便易行,适合作为一个预测模型来预测用户的页面访问模式。就此对Markov预测模型进行深入研究,描述了其实现算法,并结合实例对混合Markov预测模型方法进行了验证。  相似文献   

16.
为使用户在手持设备上提取用户兴趣是重要基础,提出一种基于用户隐式反馈的方法。该方法从网页中提取兴趣块(用户感兴趣的网页内容),假设用户的浏览行为如在块上的停留时间、滚动次数、滚动速度、进入链接的次数等与用户是否对块感兴趣相关。从手持设备上的浏览行为中提取了34种隐式反馈特征,通过分析18个用户在608个网页的9474个块上的浏览行为,验证了其中29种特征与兴趣块的相关性,并且这种相关性能用于跨用户、跨网站的兴趣块提取。该文的研究成果可用于建立个性化的用户偏好模型,应用在手持设备上的自适应网页浏览中。  相似文献   

17.
基于Web日志的匿名网络用户聚类研究   总被引:2,自引:0,他引:2  
该文探讨了从Web日志中提取匿名网络用户会话信息的方法以及会话向量的表述形式,并利用网页的层次性减少会话向量的维数,确定了用户会话之间的相似度的计算公式,最后采用leader层次聚类算法完成匿名网络用户会话聚类。实验结果表明,这种方法是高效可行的,可以较好地解决扩展性和动态聚类等问题。  相似文献   

18.
指出了用户验证是实现网站安全的重要手段,而PHP语言、Apache服务器和MySQL数据库作为实现动态网站开发的最佳拍档,是实现网上用户验证的首选工具.在介绍了PHP、Apache和MySQL的特性之后,对PHP实现Web页面对数据库访问的原理作了详细的讨论,总结和提出了3种有效的基于PHP/MySQL的网上用户验证方法.  相似文献   

19.
基于兴趣相似性的Web用户聚类   总被引:8,自引:0,他引:8  
按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号