首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 550 毫秒
1.
基于URL语义分析的Web用户会话识别方法   总被引:1,自引:0,他引:1  
由于现有基于时间和引用的经典会话识别方法在复杂Web使用模式挖掘中存在局限性,提出了一个基于URL语义分析的用户会话识别新方法.这个方法借助Web目录服务,将Web日志中的每一条URL记录赋予一定的语义信息,并给出一些测度指标对URL之间的语义相似度进行评价.对静态和流动两类Web日志情况进行分析,分别给出了语义奇异值...  相似文献   

2.
基于语义的Web用户会话识别算法   总被引:2,自引:0,他引:2  
研究一种基于语义进行Web用户会话识别的算法. 通过建立的语义化预处理模型对使用日志进行扩展,利用基于本体语义度量的Markov链模型识别用户请求所应归属的会话,提出用竞争激励算法判别会话的结束状态. 实验结果表明,基于语义的用户会话识别算法的平均识别率为69.8%,高于时间阈值、向前参考等算法.  相似文献   

3.
介绍Web语义和使用挖掘及个性化服务的基本概念,提出一个集成Web语义和使用挖掘的个性化模型,能进一步提高个性化系统的效率和精度并对模型的体系结构、领域本体论生成以及Web使用挖掘等方面进行了详细的论述.  相似文献   

4.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

5.
一种新的Web事务模糊聚类算法的研究   总被引:11,自引:1,他引:11  
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。  相似文献   

6.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

7.
Web应用系统已经应用到各个领域,研究Web应用的可靠性日益重要.首先定义Web应用失效,引出了Web应用可靠性的概念;通过分析IIS日志数据,收集相应的用户操作和信息传送失效数据,从Web应用软件系统的角度探讨了基于日志的Web应用可靠性评估的可行性.基于网站用户群使用特征的规律性,提出了一种新型工作量计算方法,该方法首先运用平均加权技术进行无单位化处理,再设置目标函数经优化得到计算新型工作量的权量.最后通过实验验证了新型工作量的有效性.实验结果表明,采用新型工作量计算Web应用的可靠度稳定性较好,可信性较高.  相似文献   

8.
Web使用挖掘是将数据挖掘和WWW这两个领域中的多种技术和方法结合起来的热门研究课题。Web使用挖掘中,数据预处理是基础、挖掘访问模式是核心、模式分析与显示是目的。在数据预处理阶段,结合时间启发方式和引用启发方式提出了时间引用启发方式的会话构造方法。该方法不仅利用了用户会话的时间特性,而且考虑了用户的浏览特性。  相似文献   

9.
针对现有事务聚类算法复杂度高、精确性不够的问题,提出了基于用户访问兴趣度的事务聚类算法。首先,在Web日志预处理阶段,通过用户兴趣度生成算法得到用户兴趣度事务,减少了聚类操作的数量,提高了聚类结果的准确性;其次,给出了事务相似度的度量方法,并得到事务相似度矩阵以实现事务聚类。该算法减轻了数据挖掘的任务,提高聚类结果的准确性,能广泛地应用于电子商务领域。  相似文献   

10.
网络日志挖掘中基于时间间隔的会话切分   总被引:10,自引:0,他引:10  
针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法。该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义。实验表明:代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP的频率矢量具有Power-law的特点,而单用户IP的频率矢量具有Gauss分布的特点,在此基础上提出一种基于Gauss假设的方法来设定不同单用户IP的阈值。与传统的对所有IP地址使用单一的先验阈值进行切分的方法相比,该方法更为合理有效。  相似文献   

11.
多接口非限制下组件化手机的Web前端容易遭遇会话劫持攻击。当前会话劫持攻击检测方法需建一个含有全部攻击特征的检测模型,不易实现,且检测结果不可靠。提出一种新型组件化手机Web前端会话劫持攻击检测方法,分析多接口非限制下组件化手机Web前端会话劫持攻击,预处理RTT历史数据,以降低多接口非限制下组件化手机Web前端奇异数据对正常数据RTT特征提取的影响。采用滑动数据窗和最小二乘平滑结合的方法对组件化手机Web前端正常数据的RTT特征进行提取,依据RTT特征提取结果,通过滑动窗口平均方法对会话劫持攻击进行检测。实验结果表明,所提方法具有很高的攻击检测精度和效率。  相似文献   

12.
基于Web挖掘的用户个性化服务研究   总被引:1,自引:0,他引:1  
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。  相似文献   

13.
The task of clustering Web sessions is to group Web sessions based on similarity and consists of maximizing the intra-group similarity while minimizing the inter-group similarity. The first and foremost question needed to be considered in clustering Web sessions is how to measure the similarity between Web sessions. However, there are many shortcomings in traditional measurements. This paper introduces a new method for measuring similarities between Web pages that takes into account not only the URL but also the viewing time of the visited Web page. Then we give a new method to measure the similarity of Web sessions using sequence alignment and the similarity of Web page access in detail Experiments have proved that our method is valid and efficient.  相似文献   

14.
随着语义Web技术的出现,传统的Web挖掘面临新的挑战.文章讨论了语义Web的体系结构、Web挖掘和Agent技术的有关概念,提出了基于多Agent的语义Web挖掘系统模型,并对其进行了分析.实验结果表明,该系统模型具有较高的准确性和效率.  相似文献   

15.
在分析、优化和整合Web表单结构的基础上,形式化地描述了表单;基于一种新型的本体构造方法,对表单建立了语义模型;这种模型可用于机器自动识别表单、准备数据和提交查询,也有助于获取查询结果的语义;最后举例说明了表单建模过程.实验证明这种建模方法是可行的,为自动查询动态Web内容奠定了基础.  相似文献   

16.
基于形式语义的Web服务交互模型   总被引:4,自引:0,他引:4  
现有的W eb服务缺少明显的语义,W eb服务之间不能很好地理解其相互传递的消息,因而不能实行W eb服务的发现、调用和组合自动化。为此,提出一种基于形式语义的W eb服务交互模型。该方法通过定义W eb服务接口描述的词汇集以及词汇集之间映射规则,实现了开放和分布式环境下的W eb服务的语义交互。与已有的方法相比,该方法考虑了分布式本体的解释及可满足性问题,可自动根据W eb服务接口的描述因子进行分布式本体推理,解决了开放和分布式环境下W eb服务的语义交互问题。  相似文献   

17.
为提高用户会话聚类的准确性,充分利用页面路径的相似性,提出了基于兴趣点的会话相似性测量方法IPB(interest-point based).该方法充分利用页面路径包含的网站层次结构所体现的分类信息,将同一目录中的页面定义为一个兴趣点.在计算会话相似性时,首先获取用户会话中的兴趣点,根据页面路径的相似性计算兴趣点的相似性,然后根据兴趣点求出会话之间的相似度.实验结果表明,该方法能够更准确地计算Web会话的相似性.  相似文献   

18.
语义Web服务是在分布式环境下构建复杂系统的一种新兴技术。该文阐述了语义Web的核心概念和多Agent系统的主要特点,在此基础上,提出了基于语义Web的多Agent系统的体系模型,并探讨了该结构对于构建开放的、动态的、异构的多Agent系统所具有的优越性。  相似文献   

19.
一种有效的Web使用挖掘体系结构   总被引:1,自引:1,他引:1  
对Web挖掘的特征、分类及与其相关的技术和工具进行了分析,针对现有的Web使用挖掘研究中缺乏统一而有效的结构模型的问题,提出了一种有效的Web使用挖掘的体系结构,并详细地分析了利用该结构模型处理Web使用挖掘的过程,最后,利用某大学网站的Web日志数据验证了该结构的有效性.  相似文献   

20.
为了便于机器理解和提高网络资源的利用率提出了语义Web .基于二元关系讨论了语义Web的建立过程 ,具体给出语义Web中相关语义的形式化定义 ,并基于此给出了语义描述和挖掘方法 ,进行了集合相关语义的完备性的证明 .为了语义Web能应用于实际网络中 ,给出了语义拓展方式的定义 ,继而完成语义Web的形式化定义 ,给出语义Web的整体模型 .最后 ,给出了若干用于检验语义有效性的方法 ,以进一步提高语义Web的实用性 ,至此可创建相对完整的语义Web .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号