首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
Web日志预处理中会话识别的优化   总被引:3,自引:0,他引:3  
针对目前的各种会话识别方法,提出了一种优化的会话切分方法.该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据.实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

2.
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.  相似文献   

3.
Web使用挖掘中的一种改进的会话识别方法   总被引:19,自引:0,他引:19  
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,为合理有效。  相似文献   

4.
提出一种利用网页特征进行会话识别的方法.通过分析网页本身的特征,计算站点中所有网页的特征向量.根据这些特征向量,可以计算任意网页之间的相关程度.按照用户请求页面在日志中的时间顺序,可以得到日志中所有直接相邻的页面记录的关联程度曲线.通过设定一个阈值,在关联程度曲线中波动较大的位置形成会话边界.将关联程度大的页面分类到一个会话中,从而完成会话识别.  相似文献   

5.
在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于 URL 页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.  相似文献   

6.
基于超图聚类的用户行为模式挖掘   总被引:3,自引:1,他引:2  
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。  相似文献   

7.
提出一种基于用户历史浏览情况对未来相关网页进行预取的算法.该算法能自适应调整用于生成会话的参数,并使用Session-tree结构完成对相关页面的预取.在实现中考虑到用户在特定事件和时间下的历史浏览行为,使用奖励因子和快速排序策略以提高效率.试验分析结果表明,基于自适应会话调整及群体共同兴趣剖像的预取算法能较好地完成对相关页面的预取.  相似文献   

8.
本系统通过端口镜像对校园网边界出口处的网络流量中TCP三次握手状态信息进行监测,并根据自定义的匹配过滤策略来精心构造会话劫持报文,以旁路方式发回给校园网内主机,来达到干预有问题的用户到外网的TCP会话的目的.干预的结果可以是立即中断TCP连接,也可以是将用户的所有HTTP访问请求重定向到指定的安全告警页面.本研究为在校园网内构建一种有效的安全告警系统提供了方向,同时也在过滤不良网站,用户身份认证等方面有着广泛应用.  相似文献   

9.
本系统通过端口镜像对校园网边界出口处的网络流量中TCP三次握手状态信息进行监测,并根据自定义的匹配过滤策略来精心构造会话劫持报文,以旁路方式发回给校园网内主机,来达到干预有问题的用户到外网的TCP会话的目的.干预的结果可以是立即中断TCP连接,也可以是将用户的所有HTTP访问请求重定向到指定的安全告警页面.本研究为在校园网内构建一种有效的安全告警系统提供了方向,同时也在过滤不良网站,用户身份认证等方面有着广泛应用.  相似文献   

10.
Web日志挖掘中的数据预处理技术   总被引:5,自引:0,他引:5  
用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统.  相似文献   

11.
The task of clustering Web sessions is to group Web sessions based on similarity and consists of maximizing the intra-group similarity while minimizing the inter-group similarity. The first and foremost question needed to be considered in clustering Web sessions is how to measure the similarity between Web sessions. However, there are many shortcomings in traditional measurements. This paper introduces a new method for measuring similarities between Web pages that takes into account not only the URL but also the viewing time of the visited Web page. Then we give a new method to measure the similarity of Web sessions using sequence alignment and the similarity of Web page access in detail Experiments have proved that our method is valid and efficient.  相似文献   

12.
针对复杂的道路工况及实时性的需求,提出了一种基于边缘特征点聚类的车道线检测方法。首先结合车道线边缘的梯度分布和灰度分布提取边缘特征点;然后依据车道线特征点的连续性和梯度方向的一致性进行特征点聚类得到离散区域,并通过衡量各区域之间的相似度进行区域聚类;最后选出最优类内的点进行拟合。在多种环境的道路场景下对该车道线检测方法进行验证,验证结果表明,该方法检测速度快、鲁棒性强,有助于实际工程应用下的车道偏离预警系统的研究。  相似文献   

13.
针对全局图像特征无法刻画图像类别信息的缺陷, 提出一种基于兴趣点特征的图像特征检索方法. 首先对图像进行仿射 尺度不变特征转换, 并利用亮度的概率密度梯度提取兴趣点; 然后将兴趣点映射回原始图像, 采用颜色直方图作为图像特征; 最后采用相似性度量模型, 实现图像检索. 选择Corel图像库中的图像对算法性能进行实验分析. 实验结果表明, 该方法可有效提高图像的检索准确率和检索效率, 快速找到用户需要的图像.  相似文献   

14.
图像亮度特征对ROI提取的影响   总被引:1,自引:0,他引:1  
提出一个基于改进的Itti-Koch模型的感兴趣区域(Region of interest,ROI)提取算法,同时针对图像亮度特征对ROI提取的影响问题,从2个方面进行分析研究:一是根据不同亮度权重下提取的ROI,分析亮度特征对ROI提取的影响程度;二是对眼动数据提取图像的ROI和基于改进的Itti-Koch模型提取的图像ROI进行区域评价,计算两者之间的点对点区域相似度和位置区域相似度.研究结果表明:当亮度特征和颜色特征同时影响图像ROI提取时,亮度特征所占权重不宜超过0.5.  相似文献   

15.
为解决工业机器人机械手末端避障路径规划需要花费大量时间,且规划的路径可能会包含大量冗余分段点的问题,提出一种基于分段点迁移递归(RSPM)和递进约简(PS)的机械手末端避障路径规划方法.通过RSPM算法可以在碰撞段上形成分段点并进行迁移,进而递归处理各分段路径,得到一条无碰撞基础路径.通过PS算法可以去除基础路径上的冗余分段点,得到最终路径.结果表明:RSPM-PS算法能快速规划更短的基础路径且能快速有效缩短路径长度.  相似文献   

16.
针对现有事务聚类算法复杂度高、精确性不够的问题,提出了基于用户访问兴趣度的事务聚类算法。首先,在Web日志预处理阶段,通过用户兴趣度生成算法得到用户兴趣度事务,减少了聚类操作的数量,提高了聚类结果的准确性;其次,给出了事务相似度的度量方法,并得到事务相似度矩阵以实现事务聚类。该算法减轻了数据挖掘的任务,提高聚类结果的准确性,能广泛地应用于电子商务领域。  相似文献   

17.
 客户兴趣点预测是大数据环境下提高电子商务推荐精度的关键,针对现有客户兴趣预测未综合考虑客户多种行为和时序时间的影响问题。为研究一种基于客户Web时空行为轨迹的兴趣点预测方法,构建了包含客户、时间、行为和兴趣点四层子网的客户Web时空行为超网络模型,并引入行为影响因子,提出基于超边相似性的兴趣点预测算法,在建立连通矩阵的基础上,通过邻接矩阵计算、超三角形判定和超边相似度计算,得到相似度最高的超边,该超边对应的兴趣点即为预测结果。实验结果表明,该方法在时间误差允许范围内,兴趣点预测准确度随时间精度的减小而增加,与传统的标签预测方法相比,预测准确度由56.2%提高至74%。  相似文献   

18.
局部路径规划强调在微观交通场景中输出一条可行驶路径,对每一离散时刻的路径点都要求有极高的安全性和舒适性。现有的局部路径规划方法中鲜有考虑路径曲率是否连续、路径起讫点约束等物理特性的基于安全换道域的换道决策与规划方法。本研究中对典型的换道场景建立了临界安全换道角模型,对无法演变为单障碍车换道场景的双障碍车换道场景建立了安全换道域。对比了几种常用换道路径,筛选出B样条曲线法作为局部路径规划方法,利用换道时间和换道路径平均曲率确定基于安全换道域的最优换道路径,并提出了基于安全换道域的换道决策,联合Simulink和PreScan计算平台在典型换道场景下实现了所提出的换道策略的仿真验证。结果表明,所提出的换道决策和换道路径规划能够实现本车的安全换道。  相似文献   

19.
针对水面无人艇(unmanned surface vessel, USV)在复杂环境下的局部路径规划问题,对USV路径规划问题进行了数学建模,提出了基于增强拓扑神经演化(neuroevolution of augmenting topologies, NEAT)算法的局部路径规划方法;设计了神经网络初始结构和演化参数,对初始神经网络结构进行演化实现避障及到达指定目标的路径规划任务;通过设计适应度函数,实现路径点数目的优化。仿真结果表明:利用NEAT算法演化神经网络的方法能够使USV在复杂的环境中准确避开障碍物并到达目标点,且在路径点数目和鲁棒性方面优于传统的模糊逻辑算法与人工势场算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号