首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
基于改进的网络蜘蛛算法抽取Web站点结构的方法   总被引:2,自引:0,他引:2  
针对传统的Web站点结构恢复方法的局限性,提出了一种基于改进的网络蜘蛛算法的Web结构抽取方法,并实现了相应的工具WebAnalyzer。该方法通过深度优先搜索策略递归遍历Web站点,同时对网页的语法、标签进行分析,提取词法信息,在此基础上形成Web结构视图和词法表。实验表明,该方法能够快速准确地恢复Web站点结构图。  相似文献   

2.
自适应Web站点站能够根据用户需要快速灵活地改变自身,动态适应不断变化的用户需求和应用环境.通过Web日志文件的挖掘,找出用户的访问模式,及该模式中的访问类型,而且分析当前访问页面的频繁度后,形成经过内容裁剪的个性化页面来压缩Web页面内容.在此基础上,设计了一个自适应站点模型,改善Web站点的结构和组织形式以使站点达到更好的效果.  相似文献   

3.
通过对Web内容挖掘、Web结构挖掘、Web使用记录挖掘的研究和分析,探讨了利用Web Services技术实现三者之间的集成,并在此基础上提出了基于Web Services的Web挖掘集成的实现方案.方案的实施,可以更容易地获得各种Web信息进而对其进行分析,从而发现潜在用户,改进站点设计,方便客户浏览和交易.  相似文献   

4.
Web日志挖掘技术及其在电子商务中的应用   总被引:3,自引:0,他引:3  
近年来,由于电子商务、电子图书馆、远程教育等的应用,对Web站点设计和功能提出了更高的要求, 要求Web站点具有智能性。介绍了目前世界上两种主要的Web曰志挖掘技术(基于Web事务和基于数据立方体),同时,提出了基于Web目志挖掘技术的应用,主要讨论了站点的在线推荐和用户自适应的Web站点设计问题,在此基础上简单介绍了一个Web日志挖掘系统原型AdaptiveWeb。它可创建用户自适应的Web站点,使其具有部分智能。  相似文献   

5.
袁晓月  黎升洪 《江西科学》2004,22(5):337-342
数据密集型Web应用是当前Web工程的热点。介绍了在高层表达Web应用结构的建模方法—WebML。给出了数据结构层、站点视图层和表现风格层所使用的记号和它们的含义。并给出了WebML开发过程和1个示例。  相似文献   

6.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

7.
姚青山  张春霞 《河南科学》2008,26(3):329-332
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息.  相似文献   

8.
Web日志挖掘技术应用研究   总被引:11,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

9.
Web使用挖掘技术通过挖掘并分析用户对Web站点的访问模式,在帮助Web站点调整结构,确定产品的市场战略,提高商业活动的效率等方面存在广泛的应用前景.如何得到准确的用户浏览行为信息,是Web访问挖掘研究的一个重点.本文主要对在客户端获取准确的用户浏览行为信息的过程进行了研究.  相似文献   

10.
Web使用挖掘技术通过挖掘并分析用户对Web站点的访问模式,在帮助Web站点调整结构,确定产品的市场战略,提高商业活动的效率等方面存在广泛的应用前景。如何得到准确的用户浏览行为信息,是Web访问挖掘研究的一个重点。本文主要对在客户端获取准确的用户浏览行为信息的过程进行了研究。  相似文献   

11.
针对路径游历问题(Path Traversal),提出了一种新的挖掘用户频繁访问路径的方法MFP(MaximalFrequent Path),该方法首次采用两种兴趣度的度量标准.即在考虑了用户覆盖面的同时,又考虑了个人贡献因素.采用该方法不丢失有用的信息,便于网页序列的预取和缓存,并且有效地避免了两个极端情况的影响(单用户多访问和多用户单访问情况),能挖掘出比其它方法更具有普遍意义的模式,并从理论上推导和验证了它的有效性.  相似文献   

12.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

13.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

14.
提出一种基于概念联想网络的网页预取模型,挖掘用户访问模式中蕴含的概念间联想模式,结合在线学习和离线挖掘两种方式,建立面向用户的概念联想网络,并基于概念联想网络实现网页预取评价。模型对网页进行概念层次的分析,提高了预取的准确性,实现了基于语义的客户端网页预取。  相似文献   

15.
提出了一种支持用户在网上的浏览活动的语义标注方法.该方法从语义上同类型的标注信息中提取特征,通过获取标注信息以建立用户意图模型,再利用概率判断识别用户意图;语义转换后得到的信息可以和其它的或被评估的用户意图进行比较;最后利用启发式函数量化具体用户意图和信息的相似度,以达到用户在浏览语义异构网络信息空间时获取相关信息的目的.  相似文献   

16.
根据用户行为模式自动生成动态链接的方法   总被引:2,自引:0,他引:2  
分析了面向用户行为来进行网页动态链的思想方法.提出了处理用户访问网站的日志数据方法,并提出聚类用户的算法思想与步骤,最后分析了每组用户动态生成每组喜欢的链接思想与算法.主要介绍如何预处理用户日志访问数据及对用户聚类.  相似文献   

17.
The development of microblog services has a considerable effect on the patterns of web access and Internet resources discovery.Understanding the interrelation between information diffusion in ordine social media and user web interests can help the web ecosystem stakeholders in developing new services and designing efficient systems with optimized resources.This paper explores whether or not one can infer the trends of topics in the web by observing the Twitter microcosm.Using datasets collected from Twitter and two representative web services(Google and Alexa),this work conducts a comparative analysis between trending patterns of topics in Twitter and in the web by considering both the temporal and spatial perspectives,and finds that individual topics in Twitter and in the web share similar trending patterns both from the temporal and spatial aspects.Nevertheless,the trendiness in Twitter can precede for a few hours and is highly unstable compared to the one in web.The application of these findings is also discussed on ad keywords planning in Search Engine Marketing.  相似文献   

18.
用户浏览偏爱模式挖掘算法的研究   总被引:2,自引:0,他引:2  
针对当前的挖掘算法只是简单地把频繁访问路径作为用户浏览的兴趣路径的问题,充分地考虑了用户在页面上的浏览时间和在路径选择上表现出来的浏览偏爱,提出了基于远程代理数据收集的浏览偏爱模式挖掘算法。该算法先利用客户端的远程代理收集用户浏览信息,然后划分成用户事务,最后利用一个递归过程找出用户浏览偏爱模式。实验证明:该算法比当前的频繁访问路径算法在用户浏览兴趣度量上更准确。  相似文献   

19.
如何对网上用户分类是W eb挖掘领域应用最多的任务之一,本文尝试将关联分类方法应用到W eb用户分类模式的挖掘.我们首先对服务器日志文件进行预处理,形成一个访问事务集;然后对该事务集进行数据挖掘,找出所有满足最小信任度和支持度的类别关联规则;最后,我们用这些类别关联规则去预测用户的兴趣.实验证明此方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号