首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

2.
基于兴趣相似性的Web用户聚类   总被引:8,自引:0,他引:8  
按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.  相似文献   

3.
提出一种基于粗糙模糊集的层次聚类算法。在该算法中,通过事务间的相似性关系生成用户事务模糊矩阵,运用基于模糊矩阵的粗糙上近似提取初始类,使用约束相似性的上近似概念形成后续类,其中的一个相对的相似性条件被用作合并准则。该算法可以帮助Web挖掘者描述潜在的新的Web用户组特性。  相似文献   

4.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

5.
基于FLAAT模糊的WEB挖掘算法   总被引:1,自引:0,他引:1  
为了挖掘出较完全的兴趣模式,提出一种新的结构类型——FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。  相似文献   

6.
搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。  相似文献   

7.
一种新的Web事务模糊聚类算法的研究   总被引:11,自引:1,他引:11  
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。  相似文献   

8.
We combine the web usage mining and fuzzy clustering and give the concept of web fuzzy clustering, and then put forward the web fuzzy clustering processing model which is discussed in detail. Web fuzzy clustering can be used in the web users clustering and web pages clustering. In the end, a case study is given and the result has proved the feasibility of using web fuzzy clustering in web pages clustering.  相似文献   

9.
基于Web日志的因特网协作推荐系统的研究   总被引:2,自引:0,他引:2  
针对当前推荐系统研究中存在的问题,提出了一个基于Web日志的Internet协作推荐系统。它在用户浏览兴趣度量时综合考虑了页面访问次数、浏览时间的长度和页面的大小,然后将具有相似用户浏览兴趣的页面进行推荐。算法过程如下:先对Web日志进行预处理后得到用户事务,然后对这些用户事务进行各个页面的浏览兴趣矢量表示,最后通过推荐引擎生成实时推荐。经实验表明,该系统比其他方法推荐的网页点击率高。  相似文献   

10.
一种基于模糊C均值聚类的图像区域分割方法   总被引:2,自引:5,他引:2  
提出一种基于模糊C均值聚类的彩色图像区域分割方法。该方法首先选用适当的彩色空间对图像中的每个像素抽取颜色、纹理及空间位置等综合特征;然后,利用模糊C均值聚类方法进行聚类,利用提出的确定最佳聚类簇数的方法,确定聚类簇数、中心等参数;根据每个像素的隶属函度,将像素初步划归不同的组,利用连接原理对图像区域进一步分割,并提供了图像描述特征。实验结果表明,该方法分割效果很好。  相似文献   

11.
随着通信用户数量的逐渐增加,当前多维信任数据协同推荐算法无法有效满足用户对资源多样性、准确性和发掘能力的要求。为此,提出一种新的定向信息推荐下多维信任数据协同推荐算法。通过矢量空间模型对用户兴趣进行描述,将具有代表性的用户看作该类用户的聚类中心,建立用户对资源的偏好矩阵,求出依据综合信任值的用户相似度;重复选择聚类中心,直至符合既定阈值。获取用户聚类结果后,选择待推荐用户所处聚类中和该用户相似的若干用户,依据上述近邻对目标资源的评分值实现目标用户对目标项目的预测。给出定向信息推荐下多维信任数据协同推荐算法的实现过程,输出Top-N多维信任数据推荐集合。实验结果表明,所提算法预测精度和资源多样性高,发掘能力强,推荐效果好。  相似文献   

12.
模糊聚类挖掘方法在电子商务中的应用   总被引:7,自引:2,他引:5  
在分析模糊技术与聚类方法的基础上,利用模糊关系矩阵,给出了一种模糊聚类的方法,这种方法利用了模糊集合中的“最小最大”运算关系·将该方法应用到具体电子商务平台的数据挖掘工作中,得到了可行性验证,从而为此技术在电子商务领域的广泛应用起到了示范作用·  相似文献   

13.
研究了面向用户兴趣的Web信息过滤系统的主要技术,包括用户兴趣表示、度量和更新、网页内容识别和网页信息过滤等技术,并在此基础上设计和实现了一个Web信息过滤系统。该系统能够进行一定的信息过滤,能够进行自学习,并随着用户兴趣的变化渐渐更新,基本能够实现用户的个性化信息服务需求。  相似文献   

14.
Web日志预处理中会话识别的优化   总被引:3,自引:0,他引:3  
针对目前的各种会话识别方法,提出了一种优化的会话切分方法.该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据.实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

15.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

16.
传统的排名方法没有考虑用户的喜好、反馈和用户兴趣,很难满足用户的个性化需求.针对这个问题,提出一种新的网页排名方法,将网页的相似度、链接结构信息、用户偏好及用户反馈相结合进行页面排名.实验结果表明,改进的排序算法在一定程度上帮助用户提高检索网页的质量,最大限度地满足用户的需求.  相似文献   

17.
基于聚类的智能网页推荐系统研究   总被引:1,自引:0,他引:1  
设计了一种智能网页推荐系统的架构,其中包括数据预处理、聚类分析和网页推荐3个子系统,可以根据网站的访问日志来对用户进行自动分类,进而对网站的新用户在线提供网页推荐。提出了路径间距离的计算方法,进而研究了聚类子系统的结构,并通过对微软网站中用户访问日志的仿真实验,说明了所述方法的有效性。  相似文献   

18.
传统的推荐算法一定程度上为学习者提供了自适应的学习服务,但忽略了用户的学习兴趣偏好,难以提供学习者满意的推荐服务.为了提高学习推荐的效率,对用户的偏好进行进算,根据兴趣偏好对基本用户进行聚类,然后根据用户之间的兴趣相似性初步预测目标用户的兴趣度,进而给用户推荐兴趣度较高的学习服务.实验结果表明,该方法可显著地提高推荐质量.  相似文献   

19.
了解用户的行为与特征对网站的设计与维护非常重要,分析网站日志可有效获取Web的访问信息.提出一种利用对网站日志文件的分析实现Web用户分类的新算法.首先对日志文件进行数据筛选及事务识别,构建出一个链接网络图;然后利用页面之间的链接关系定义评估页面之间相似性的新指标,合并相似的页面,形成一个压缩链接图;使用FDOD对链接图中的链接路径进行分类.实验表明,该分类算法具有易于使用、响应迅速以及准确性高等优点。  相似文献   

20.
针对现有事务聚类算法复杂度高、精确性不够的问题,提出了基于用户访问兴趣度的事务聚类算法。首先,在Web日志预处理阶段,通过用户兴趣度生成算法得到用户兴趣度事务,减少了聚类操作的数量,提高了聚类结果的准确性;其次,给出了事务相似度的度量方法,并得到事务相似度矩阵以实现事务聚类。该算法减轻了数据挖掘的任务,提高聚类结果的准确性,能广泛地应用于电子商务领域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号