首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
随着网络环境的愈加复杂,用户数量和种类显著增加,网络信息更新频繁.针对文本数据自身较稀疏、不规范等特点,提出了基于改进的局部序列比对算法的用户会话聚类新方法.首先通过计算用户会话集成距离方法衡量会话的相似度;然后,采用改进的基于用户会话距离的序列比对算法对话题进行聚类,该算法改善了传统用户聚类算法的不足.实验表明,该算...  相似文献   

2.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

3.
为研究如何帮助社交网络中虚拟团队从海量的用户中筛选更多行为相似的用户加入团队,建立了一种基于社交网络的团队成员推荐模型,为虚拟团队推荐一些行为特征相似的用户作为候选团队成员。通过对用户信息和团队信息进行分词处理,得到用户标签向量集和团队标签向量集;将基于遗传算法的聚类算法应用于团队标签向量集,得到团队聚类簇和团队聚类中心;在此基础上,将团队聚类中心作为用户集的初始聚类中心,聚类出行为特征与团队聚类中心相似的用户簇,将这些用户簇作为相应团队聚类簇的候选推荐用户;再应用协同过滤思想,筛选出团队推荐成员列表。实验结果表明,该算法有效地解决了虚拟团队成员推荐问题。  相似文献   

4.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

5.
基于超图聚类的用户行为模式挖掘   总被引:3,自引:1,他引:2  
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。  相似文献   

6.
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。  相似文献   

7.
个性化搜索中用户兴趣模型匿名化研究   总被引:2,自引:1,他引:1  
为了解决个性化搜索技术所潜在的用户隐私信息泄露的问题,提出了用户兴趣模型匿名化方法。首先根据用户兴趣模型之间的相似性将其聚类为满足p-链接性的等价组,然后计算聚类后兴趣条目的权值。所谓的p-链接性是指攻击者根据背景知识链接确定某一用户的概率不超过p。该方法可实现用户兴趣模型匿名化以及兴趣倾向不发生改变,既保护了用户隐私信息,同时也保证了个性化检索性能。实验表明:随着相关结果个数的增多,匿名化后搜索结果的查全率基本能保证在50%以上,另外p-链接性的减小对于查全率的影响并不是太大。  相似文献   

8.
数据分析量巨大、逻辑关系复杂以及人工依赖程度高等因素增加了电子数据取证中行为分析的难度。针对网络入侵行为取证,提出了一种基于改进K-means聚类的机器学习分析方法。该算法改善了原有算法应用于取证所导致的缺陷问题,使初始聚类中心和聚类数能够依据向量分布情况自主进行设置,实现了网络行为智能属性归类。首先预处理网络行为数据,利用PV-DM模型将其向量化,基于改进算法寻找局部向量间相似度之和最大的向量,进而确定聚类中心与聚类数目,实现行为分类,由已知入侵行为信息关联出未知入侵用户及其行为,提升取证效率与结果完整性。  相似文献   

9.
针对认知无线电网络中传统频谱感知方法性能不足以及空白频谱利用率较低的问题,提出了一种基于核支持向量的主用户活动场景分类算法,通过判断地理区域内的活动主用户数量及分布情况来提高获得潜在频谱接入机会的可能性。根据核支持向量的边界对主用户活动场景作初分类处理,由此判定当前网络中的活跃主用户发射机的数量。初分类处理既能减少支持向量中矩阵计算量,也能减少人工标记数据所带来的成本。再对每一个初分类处理后的数据进行无监督聚类,从而得到实际对应的主用户活动场景细分类。实验结果表明,所提算法与直接使用核支持向量分类算法相比,不仅改善了频谱感知的性能,同时还大大降低了定标成本及时间成本。  相似文献   

10.
分析了用户访问Web站点的浏览日志,度量用户的浏览行为.实验从实际获得的Web日志着手,进行Web日志的挖掘,提取用户浏览Web的行为特性数据.通过时间阈值进行会话的划分,选取合适的数据预处理,归一化后生成数据模式向量,引入人工神经网络中的自组织特征映射(SOM)模型,对用户访问倾向聚类,对用户浏览的偏爱度进行度量,为Web站点的进化提供依据.  相似文献   

11.
基于兴趣度网页智能链接的聚类方法   总被引:1,自引:0,他引:1  
提出一种新的用户访问聚类方法,采用模糊聚类原则,将已有的用户访问主页的URL记录快速、有效地为有相似兴趣、爱好的访问者访问记录群聚类 利用这种方法对访问用户聚类,再根据其聚类结果推荐给用户相应的动态链接.  相似文献   

12.
We combine the web usage mining and fuzzy clustering and give the concept of web fuzzy clustering, and then put forward the web fuzzy clustering processing model which is discussed in detail. Web fuzzy clustering can be used in the web users clustering and web pages clustering. In the end, a case study is given and the result has proved the feasibility of using web fuzzy clustering in web pages clustering.  相似文献   

13.
Web服务器负载均衡会话保持的研究   总被引:1,自引:0,他引:1  
负载均衡的集群环境中会话保持方法直接影响到动态网站运行的性能.对现有几种集群环境中会话保持的方法进行了研究,提出一种粘性会话服务器方法.通过比较测试,使用该方法系统性能随并发用户增加而下降的趋势不明显.  相似文献   

14.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

15.
Web用户聚类研究   总被引:1,自引:0,他引:1  
Web日志数据的海量增长,要求聚类算法能高效的从海量数据中得到满意的用户聚类.本文提出了一种新的聚类算法,在聚类前,利用用户兴趣度对海量数据集进行约简、减小数据计算规模,然后再对Web用户进行聚类.实验证明这种方法能减小数据规模、提高聚类效率,并得到满意的用户聚类.  相似文献   

16.
针对用户在搜索结果列表中寻找所需信息困难的问题,在分析了Web搜索结果的特点的基础上,提出了一种结合K-Means的层次化方法对搜索结果进行聚类,并通过向用户提供查询结果的类别标签分类显示结果,从而大大提高可浏览性.同时,在该方法的基础上设计并实现了一个搜索结果聚类原型系统,实验结果表明新方法是可行的.  相似文献   

17.
基于聚类的智能网页推荐系统研究   总被引:1,自引:0,他引:1  
设计了一种智能网页推荐系统的架构,其中包括数据预处理、聚类分析和网页推荐3个子系统,可以根据网站的访问日志来对用户进行自动分类,进而对网站的新用户在线提供网页推荐。提出了路径间距离的计算方法,进而研究了聚类子系统的结构,并通过对微软网站中用户访问日志的仿真实验,说明了所述方法的有效性。  相似文献   

18.
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.  相似文献   

19.
一种基于后缀树的中文网页层次聚类方法   总被引:1,自引:3,他引:1  
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比。聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。  相似文献   

20.
提出了一种基于大规模多输入多输出滤波器组多载波(MIMO-FBMC)系统下行链路的用户聚类算法.在用户组数量和用户数量随机的环境下,该算法将用户和用户之间信道向量的相关系数自适应地表示为无向干扰图,边的权重表示为相邻用户之间信道向量干扰强度,然后根据每个图的权重值之和与阈值比较进行分簇,仿真结果表明,在基站(BS)天线数量不同的情况下,该算法性能优于传统的用户分组方法,并降低了算法复杂度,提高了系统总和速率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号