共查询到19条相似文献,搜索用时 62 毫秒
1.
朱月秀 《漳州师范学院学报》2005,18(4):15-20
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法. 相似文献
2.
基于模糊聚类的网站用户分类 总被引:3,自引:0,他引:3
文章给出了模糊聚类在网站用户分析中的应用。首先对web日志挖掘作了系统的介绍,包括对服务器上日志结构的分析和对数据预处理过程的描述,然后讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。为web站点的个性化服务提供了基础。 相似文献
3.
一种新的Web事务模糊聚类算法的研究 总被引:11,自引:1,他引:11
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。 相似文献
4.
采用路径划分聚类算法,对Web用户访问路径进行划分,然后根据其相似度进行聚类,依据分类系数和平均模糊熵来判定簇个数的最优解,得到较好的聚类效果,为最终挖掘出用户的访问模式奠定了良好的基础.实验发现簇中心偏移次数明显减少,中心长度有所提高,证明算法具有较好的效率. 相似文献
5.
林国平 《漳州师范学院学报》2005,18(4):21-27
Internet飞速发展在带给人们很多方便的同时,也出现了一个新问题,即如何从大量的Web日志数据中快速而方便的找到所需要的信息,Web日志挖掘是其关键技术之一.本文使用了RACE算法及使用长度分析实现了Web序列模式的日志挖掘,并进行了实例分析. 相似文献
6.
吕佳 《重庆师范大学学报(自然科学版)》2007,24(2):32-35
Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。 相似文献
7.
8.
宁建飞 《海南大学学报(自然科学版)》2012,30(4):354-359
通过处理和研究Web日志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务. 相似文献
9.
10.
针对传统模糊聚类算法需要预先确定初始隶属度矩阵的问题,该文提出了基于增量式模糊聚类算法(Incremental fuzzy clustering algorithm, FCLDA)的文本挖掘方法。首先根据文本集中关键词出现次数进行排序,优先选择出现次数多的关键词作为文本集的主题,然后利用隐含狄利克雷分布(Latent Dirichlet allocation, LDA)主题模型构建文档-主题概率分布组成矩阵,将该矩阵作模糊C均值聚类(FCM)算法的隶属度矩阵,并对隶属度矩阵的隶属度值增加一个权值,在FCLDA算法迭代过程中,采用模糊信息熵作为聚类数确定的标准,增加主题词,当模糊信息熵达到最小值时,聚类数确定下来,最后将FCLDA算法应用到网页的文本挖掘中,结果试验表明,相对于FCM算法和K最近邻(K-nearest neighbor)算法,FCLDA算法的运行聚类结果准确率更高,运行速度加快,更适合处理具有模糊性的文本。 相似文献
11.
有效的用户识别与用户细分是网站用户行为分析的基础.针对现有用户识别算法将注册用户和匿名用户均按匿名用户处理,导致用户分类不细致的问题,提出了一种匿名用户识别算法.该算法通过识别用户访问行为状态,采取页面访问路径和浏览时长匹配方式,进一步识别IP地址变化后混入纯匿名用户中的注册匿名用户,从而把用户细分为注册用户、假匿名用户和纯匿名用户.实验结果表明,该算法能够提高匿名用户识别率,更加准确地识别假匿名用户. 相似文献
12.
Web日志中挖掘用户浏览模式的研究 总被引:24,自引:0,他引:24
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。 相似文献
13.
With the development of web 2.0, more and more social community applications appeared. The classical type of this kind of application is blog and facebook. The most important feature of these applications is that it is a self-media and users can post their own ideas in Interact. By using these social commtmity applications, a big social network is formed. To study the feature of social network,it is important to mine the individual information at the beginning.In this paper, we propose a User Role based method to mine the relation between the user and object thing. First, we extract the UserRole from the semantic dictionary Wordnet. Then, the feature of User Role is also mined by considering the hypemymy and hyponymy relation. Finally, we can use these features to deduce the User Role.In our experiments, we use a big corpus from TREC 2006 to test the mining performance. The experiment results show that the User Role effectively explores the feature of user. 相似文献
14.
数字化校园发展迅速,同时带来了海量的网络信息.本文针对校园信息传播及其监控的有效性问题,设计并实现了基于Web日志分析的校园网受众分析系统,通过挖掘Web日志中的相关数据并进行统计、分析、综合,得到了特定信息在特定时期内的传播范围及其用户分布情况,同时基于访问量特征提出了校园网信息的3种基本类型.本文还结合实际校园网的运行数据进行了实验和相应的分析,显示出所建立模型的合理性和有效性. 相似文献
15.
数字化校园发展迅速,同时带来了海量的网络信息.本文针对校园网信息传播及其监控的有效性问题,设计并实现了基于Web日志分析的校园网受众分析系统,通过挖掘Web日志中的相关数据并进行统计、分析、综合,得到了特定信息在特定时期内的传播范围及其用户分布情况,同时基于访问量特征提出了校园网信息的3种基本类型.本文还结合实际校园网的运行数据进行了实验和相应的分析,显示出所建立模型的合理性和有效性. 相似文献
16.
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能够较好地用于改进网站设计,进而提高用户服务质量。最后与NPPMA算法在有效度方面进行了比较,以此证明算法的可取之处。 相似文献
17.
基于FLAAT模糊的WEB挖掘算法 总被引:1,自引:0,他引:1
吴瑞 《武汉科技大学学报(自然科学版)》2005,28(3):270-272
为了挖掘出较完全的兴趣模式,提出一种新的结构类型——FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。 相似文献
18.
叶彩虹 《安庆师范学院学报(自然科学版)》2004,10(4):109-111
Internet的迅速发展,使得WorldWideWeb已成为一个巨大的信息资源库,为Web挖掘研究提供了丰富的信息资源,同时也提出了新的挑战。该文首先概述了数据挖掘和Web挖掘的概念、挖掘流程及算法,然后介绍了电子商务及网上购物的概念及现状,并结合具体实例讨论分析了Web挖掘在网上购物中的应用。 相似文献