首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
Web上用户行为的挖掘是Web日志挖掘的重要内容,挖掘到的查找路径能够提供决策支持。分析频繁项集挖掘和路径挖掘的不同之处,提出了类Apriori算法,使之适用于路径挖掘,然后在VC++中针对预处理过的日志数据进行实验分析,获得了一些可信度高的关联页面,这些页面关联信息将有助于改进商业站点结构,提高站点的访问率。  相似文献   

2.
Web使用挖掘中的一种改进的会话识别方法   总被引:19,自引:0,他引:19  
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,为合理有效。  相似文献   

3.
利用Web日志挖掘技术构建自适应网站   总被引:2,自引:2,他引:0  
利用基于图结构Web日志挖掘获得的规则和用户访问模式,使Web站点的结构及站点内的页面进行自身的调整和改善,从而实现站点组织结构的优化.  相似文献   

4.
自适应Web站点站能够根据用户需要快速灵活地改变自身,动态适应不断变化的用户需求和应用环境.通过Web日志文件的挖掘,找出用户的访问模式,及该模式中的访问类型,而且分析当前访问页面的频繁度后,形成经过内容裁剪的个性化页面来压缩Web页面内容.在此基础上,设计了一个自适应站点模型,改善Web站点的结构和组织形式以使站点达到更好的效果.  相似文献   

5.
基于Web使用挖掘的个性化站点研究   总被引:1,自引:0,他引:1  
针对用户特性向用户提供服务的个性化Web站点已经成为Web技术的研究热点.将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,形成了Web使用挖掘.通过建立与更新用户模式库,个性化Web站点为用户的访问提供推荐.研究了Web使用挖掘技术,并对个性化Web站点的建立进行了探讨.  相似文献   

6.
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴趣度的概念,给出了Web站点访问的一种矩阵表示模型,在此基础上挖掘用户浏览偏爱路径。结论该方法能准确地反映用户浏览兴趣,证明该系统具有较高的准确性。  相似文献   

7.
陈红丽 《科学技术与工程》2012,12(8):1928-1930,1935
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。 文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。  相似文献   

8.
张佳  梁少华 《科技信息》2007,(2):20-20,53
Web结构挖掘是对Web页面之间的结构进行挖掘。挖掘对象主要是页面的超链接结构,这种结构为人们增强对网页的分析处理提供了极大的帮助。本文对基于超链接的Web结构挖掘进行了概述,并对其主要算法PageRank进行了研究。  相似文献   

9.
基于Web内容挖掘的论坛发贴分类推荐技术   总被引:1,自引:0,他引:1  
随着Internet基础结构的不断扩大和其所含信息的持续增长,Internet用户感觉越来越容易在WWW服务中"资源迷向".目前提高用户使用效率的方法有页面预取技术、站点动态重构技术和Web个性化推荐技术等.因为网站的页面内容才是用户真正感兴趣的,本文应用了一种基于Web内容挖掘的文本分类技术来实现论坛中贴子的分类推荐...  相似文献   

10.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

11.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

12.
Web推荐系统能为用户提供有针对性的个性化服务。但目前基于协同过滤和使用挖掘的推荐系统存在着诸如数据信息的不完整或不正确,推荐精度和质量不高等问题。为提高推荐系统的性能,必须将站点的内容和结构信息以及用户行为数据集成形成混合模式推荐系统,在推荐引擎里统一使用。基于此,本文提出一种新型Web推荐系统框架,能够将站点的内容,结构和用户的浏览行为综合考虑形成用户浏览模型,通过用户模型向用户推荐资源,初步实验表明该模型能有效改善推荐系统的性能。  相似文献   

13.
网页正文信息抽取新方法   总被引:6,自引:0,他引:6  
基于包装器的信息抽取方法只能处理一种特定的信息源,而且对网页结构的依赖性强.基于此提出了一种将中文标点符号和HTML树结构作为识别网页正文内容重要特征的网页分析方法,通过统计中文标点符号确定部分正文信息,然后根据正文信息在结构上的相似性确定其他正文信息内容.实验结果表明该方法能有效地剔除网页噪音并提取网页正文,具有较好的通用性和较高的准确性.  相似文献   

14.
基于聚类的智能网页推荐系统研究   总被引:1,自引:0,他引:1  
设计了一种智能网页推荐系统的架构,其中包括数据预处理、聚类分析和网页推荐3个子系统,可以根据网站的访问日志来对用户进行自动分类,进而对网站的新用户在线提供网页推荐。提出了路径间距离的计算方法,进而研究了聚类子系统的结构,并通过对微软网站中用户访问日志的仿真实验,说明了所述方法的有效性。  相似文献   

15.
传统的排名方法没有考虑用户的喜好、反馈和用户兴趣,很难满足用户的个性化需求.针对这个问题,提出一种新的网页排名方法,将网页的相似度、链接结构信息、用户偏好及用户反馈相结合进行页面排名.实验结果表明,改进的排序算法在一定程度上帮助用户提高检索网页的质量,最大限度地满足用户的需求.  相似文献   

16.
使用WEB标准是网页学习者、设计者需要面对的一个重要问题.虽然目前WEB标准还处于推荐遵循的阶段,但支持的观点认为严格执行WEB标准能在网页设计过程中带来诸多好处.介绍了WEB标准的基本体系,分别论述了设计中严格执行WEB标准带来的好处以及现阶段非严格执行标准的理由,并给出了网页设计中如何执行WEB标准的建议.  相似文献   

17.
了解用户的行为与特征对网站的设计与维护非常重要,分析网站日志可有效获取Web的访问信息.提出一种利用对网站日志文件的分析实现Web用户分类的新算法.首先对日志文件进行数据筛选及事务识别,构建出一个链接网络图;然后利用页面之间的链接关系定义评估页面之间相似性的新指标,合并相似的页面,形成一个压缩链接图;使用FDOD对链接图中的链接路径进行分类.实验表明,该分类算法具有易于使用、响应迅速以及准确性高等优点。  相似文献   

18.
为了解决传统Web应用程序在页面重载循环方面的局限性,采用了Ajax与Struts框架相结合的技术,并以商情网站应用为例,介绍了在数据校验和级联菜单两个方面的应用。其中主要利用XMLHttpRequest以异步方式向Servlet发送请求,然后利用DOM解析服务器的返回并完成对页面的更新。通过一系列的应用,证明了与传统web应用程序相比,它在减轻服务器的负担,无刷新更新页面,调用外部数据,以及促进页面呈现与数据的分离等几个方面都存在优势。  相似文献   

19.
由于超链接语言结构本身所提供的信息,网页分类问题不同于一般的文本分类。本文分析了网页内部特征,并在1000篇网页规模语料库的基础上,通过试验对比了三种特征选择方法对高维特征向量空间进行降维的效果。文章还提出了一种新方法,根据特征项所处的位置赋予不同权重的方法,实验表明这种由文本结构导出的权重计算方法能够取得很好的分类效果。  相似文献   

20.
分析了搜索引擎的检索效率和检索质量,指出目前影响搜索引擎检索效率和检索质量的主要因素是检出信息相关度低、信息重复出现率高等问题,提出了提高检出信息相关度、降低检出信息重复出现的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号