首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
用户浏览偏爱模式挖掘算法的研究   总被引:2,自引:0,他引:2  
针对当前的挖掘算法只是简单地把频繁访问路径作为用户浏览的兴趣路径的问题,充分地考虑了用户在页面上的浏览时间和在路径选择上表现出来的浏览偏爱,提出了基于远程代理数据收集的浏览偏爱模式挖掘算法。该算法先利用客户端的远程代理收集用户浏览信息,然后划分成用户事务,最后利用一个递归过程找出用户浏览偏爱模式。实验证明:该算法比当前的频繁访问路径算法在用户浏览兴趣度量上更准确。  相似文献   

2.
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴趣度的概念,给出了Web站点访问的一种矩阵表示模型,在此基础上挖掘用户浏览偏爱路径。结论该方法能准确地反映用户浏览兴趣,证明该系统具有较高的准确性。  相似文献   

3.
通过跟踪用户的兴趣与行为提出一种采用显示和隐式相结合的方式创建用户兴趣模型的方法.对用户浏览的WEB页面和用户浏览网页的浏览行为进行分析,得到用户兴趣模型.  相似文献   

4.
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能够较好地用于改进网站设计,进而提高用户服务质量。最后与NPPMA算法在有效度方面进行了比较,以此证明算法的可取之处。  相似文献   

5.
基于马尔科夫模型的浏览路径预测,仅仅从用户的浏览会话本身出发来预测用户下一步的链接,并不能捕获用户的真正兴趣所在。运用隐马尔科夫模型来分析用户浏览网页的内容,可进一步捕获用户的浏览兴趣,并作下一步的链接预测。当浏览序列长度逐渐增加,系统捕获的用户浏览信息越来越多,此时能够折射出用户的兴趣所在,预测准确率也逐步增加。当浏览序列长度大于或等于8时,预测准确率已经到达80%,提高了预测准确率。  相似文献   

6.
面向云计算环境中多租户应用的租户个性化服务需求,从多租户应用日志记录挖掘出租户兴趣浏览路径受到关注。针对传统的以浏览频度为主体的网络拓扑图研究问题,为了更好地找出租户在云平台网站上的兴趣网页,挖掘租户的兴趣浏览路径,综合租户对网页的浏览时长、接收字节数和浏览频度等多个要素定义租户兴趣度,构造租户执行图,纠正路径交叉状况以消除租户执行图中存在的多余路径,对循环路径中的对等节点进行整合以 消除循环嵌套,给出了 一种基于分层排队网(layered queue network, LQN)模型的租户兴趣浏览路径挖掘方法,在此基础上,借助广度优先遍历(breadth first search, BFS)算法进行挖掘。实验证明,改造后的LQN模型在租户兴趣浏览路径挖掘方面的效率有所提高。  相似文献   

7.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣,这种兴趣程度可以通过用户对Web站点上页面的浏览顺序及页面上的浏览时间表现出来.通过对Web用户访问路径的分析,提出一种基于浏览路径及浏览时间的相似度的度量方法.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader聚类算法Web用户的有效性.  相似文献   

8.
基于兴趣相似性的Web用户聚类   总被引:8,自引:0,他引:8  
按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.  相似文献   

9.
谢江 《科技信息》2010,(3):41-41,11
在网络时代的今天,不同类型,不同内容,不同结构的网站浩如烟海,而网站建设所面临的一个主要问题是:如果能够深入了解用户的浏览兴趣和浏览习惯、预测用户的浏览路径,就可以通过修改网页结构来提高用户的浏览效率,从而提高网站的访问量和访问效率。前人采用基于Markov链用户浏览预测模型的方法对用户的浏览路径进行预测,其缺点是不能确切反应出用户所感兴趣的网页类别,以及用户在不同类别间访问跳转的联系,本文试图通过首先将网页分类,从而基于“网页类”再对用户的浏览进行预测,可以达到了解用户对不同类别网页访问习惯的目的,从而提高网站开发设计的质量。  相似文献   

10.
为了分析网络用户的浏览行为特征,实现科学平台的网络个性化服务,用广义频繁子序列挖掘算法,该算法挖掘Web服务器日志中的用户浏览路径,设计科学平台用户的浏览模式,为用户提供主动式信息服务.经过对日志文件的预处理,得到用户会话文件,然后采用广义频繁子序列挖掘算法对用户浏览模式进行识别.实际应用表明,这种广义频繁子序列识别方法能够有效地发现用户的兴趣所在,从而更好地为用户在线浏览提供帮助.  相似文献   

11.
Web-tog contains a lot of information related with user activities on the Internet. How to mine user browsing interest patterns effectively is an important and chattengeable research topic. On the analysis of the present algorithm‘s advantages and disadvantages, we propose a new concept: support-interest. Its key insight is that visitor will backtrack if they do not find the information where they expect. And the point from where they backtrack is tbe expected location for the page. We present User Access Matrix and the corresponding algorithm for discovering such expected locations that can handle page caching by the browser. Since the URL-URL matrix is a sparse matrix which can be represented by List of 3 tuples, we can mine user preferred sub-paths from the computation of this matrix. Accordinglyo all the sub-paths are merged, and user preferred paths are formed. Experiments showed that it was accurate and scalable. It‘s suitable for website based application, such as to optimize website‘s topologicat structure or to design personalized scrvices.  相似文献   

12.
为使用户在手持设备上提取用户兴趣是重要基础,提出一种基于用户隐式反馈的方法。该方法从网页中提取兴趣块(用户感兴趣的网页内容),假设用户的浏览行为如在块上的停留时间、滚动次数、滚动速度、进入链接的次数等与用户是否对块感兴趣相关。从手持设备上的浏览行为中提取了34种隐式反馈特征,通过分析18个用户在608个网页的9474个块上的浏览行为,验证了其中29种特征与兴趣块的相关性,并且这种相关性能用于跨用户、跨网站的兴趣块提取。该文的研究成果可用于建立个性化的用户偏好模型,应用在手持设备上的自适应网页浏览中。  相似文献   

13.
聚类分析算法作为一种主要的Web使用挖掘技术,在个性化推荐系统中得到了广泛应用,然而面对Web动态性所引起的网页的更新以及用户行为方式的改变,已有的聚类算法并不能很好地解决这一问题。针对这一问题,本文以一种无向图的形式表示用户对网站的访问,提出一种可实时反映网站及用户行为变化情况的增量式页面聚类算法,并在页面聚类的基础上提出相应的推荐决策算法动态生成页面推荐。  相似文献   

14.
基于查询\|概念的用户兴趣模型构建   总被引:1,自引:0,他引:1  
针对查询\|概念二分图因概念抓取和查询词权重设计不足而导致构建的用户兴趣模型不合理的问题, 提出一种基于查询\|概念二分图的用户兴趣建模算法。通过tf×idf公式抓取概念, 并利用用户对查询词的浏览时间计算查询词的权重, 确保改进后的查询\|概念二分图能更准确地表示用户的查询意图。实验结果表明, 该算法构建的用户兴趣更为合理。  相似文献   

15.
一种高效的个性化中文分词词典   总被引:1,自引:0,他引:1  
Web个性化服务的核心技术之一是准确描述用户兴趣的用户模型,通过用户行为来挖掘用户兴趣是这一领域研究的重要手段.该文为了对Web个性化服务中用户浏览文档进行分析研究,采用了一种新型的个性化分词词典,通过实验证明是切实可行的,并且极大提高了系统的效率.  相似文献   

16.
提出了一种支持用户在网上的浏览活动的语义标注方法.该方法从语义上同类型的标注信息中提取特征,通过获取标注信息以建立用户意图模型,再利用概率判断识别用户意图;语义转换后得到的信息可以和其它的或被评估的用户意图进行比较;最后利用启发式函数量化具体用户意图和信息的相似度,以达到用户在浏览语义异构网络信息空间时获取相关信息的目的.  相似文献   

17.
Web2.0为信息检索提供了很多可以使用的资源,其中两种资源对于个性化检索而言非常有益,那就是社会化标注和网页分类信息。用户给出的标签反映了其对于网页的认识和思考,而用户标注过的网页的类别则反映了用户在选择时的偏好和兴趣,两者的结合使用对个性化检索能起到良好的效果。在仅使用社会化标注进行个性化检索的方法上,提出基于标注和网页分类进行个性化检索的方法,通过两者结合筛选出兴趣和偏好相近的用户,进行用户属性的扩展,并在扩展时考虑用户的质量,从而能在个性化检索中取得更好的结果。在真实数据集上的实验表明,本文方法具有一定的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号