共查询到18条相似文献,搜索用时 93 毫秒
1.
朱月秀 《漳州师范学院学报》2005,18(4):15-20
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法. 相似文献
2.
3.
基于模糊聚类的网站用户分类 总被引:3,自引:0,他引:3
文章给出了模糊聚类在网站用户分析中的应用。首先对web日志挖掘作了系统的介绍,包括对服务器上日志结构的分析和对数据预处理过程的描述,然后讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。为web站点的个性化服务提供了基础。 相似文献
4.
对Web日志进行有效聚类,可得到网站不同访问群和访问模式,研究了Web用户群模糊聚类关键技术.因为Web数据既有定量属性,又有定性属性,对Web用户群的聚类挖掘采用了模糊聚类方法,并设计了基于用户群的页面推荐函数.试验证明,Web用户群模糊聚类挖掘方法是有效的. 相似文献
5.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 . 相似文献
6.
为了提高分布式Web日志挖掘能力,提出基于模糊聚类的分布式Web日志挖掘方法.构建分布式Web日志的关联规则分布集,采用模糊信息聚类分析方法进行分布式Web日志关联规则特征聚类处理,提取分布式Web日志性的多重关联特征量,结合重叠性迭代检测方法进行分布式Web日志挖掘过程中的自适应寻优,采用模糊关联规则调度方法进行分布... 相似文献
7.
针对传统模糊聚类算法需要预先确定初始隶属度矩阵的问题,该文提出了基于增量式模糊聚类算法(Incremental fuzzy clustering algorithm, FCLDA)的文本挖掘方法。首先根据文本集中关键词出现次数进行排序,优先选择出现次数多的关键词作为文本集的主题,然后利用隐含狄利克雷分布(Latent Dirichlet allocation, LDA)主题模型构建文档-主题概率分布组成矩阵,将该矩阵作模糊C均值聚类(FCM)算法的隶属度矩阵,并对隶属度矩阵的隶属度值增加一个权值,在FCLDA算法迭代过程中,采用模糊信息熵作为聚类数确定的标准,增加主题词,当模糊信息熵达到最小值时,聚类数确定下来,最后将FCLDA算法应用到网页的文本挖掘中,结果试验表明,相对于FCM算法和K最近邻(K-nearest neighbor)算法,FCLDA算法的运行聚类结果准确率更高,运行速度加快,更适合处理具有模糊性的文本。 相似文献
8.
一种新的Web事务模糊聚类算法的研究 总被引:11,自引:1,他引:11
提出了一种新的Web事务模糊聚类算法。首先,在Web日志预处理后建立Web站点用户访问矩阵,矩阵元素为用户访问离散化时间,在此基础上进行Web事务群体的模糊聚类,最后对在线的活动Web事务进行类别归属。经实验证明,该算法比已有的算法准确性高,运行时间少,扩展性好,它可以广泛地应用于电子商务领域,如个性化Web和Web推荐系统等。 相似文献
9.
模糊聚类应用于MIS子系统划分的研究 总被引:1,自引:0,他引:1
袁兆山 《合肥工业大学学报(自然科学版)》1995,(4)
本文介绍了模糊聚类应用于MIS子系统划分的新方法,包括基于模糊等价关系的方法和基于模糊相似关系的“最大树”方法. 相似文献
10.
基于Web日志的匿名网络用户聚类研究 总被引:2,自引:0,他引:2
该文探讨了从Web日志中提取匿名网络用户会话信息的方法以及会话向量的表述形式,并利用网页的层次性减少会话向量的维数,确定了用户会话之间的相似度的计算公式,最后采用leader层次聚类算法完成匿名网络用户会话聚类。实验结果表明,这种方法是高效可行的,可以较好地解决扩展性和动态聚类等问题。 相似文献
11.
SHEN Jie LIN Ying CHEN Zhimin 《武汉大学学报:自然科学英文版》2006,11(5):1081-1085
To alleviate the scalability problem caused by the increasing Web using and changing users' interests, this paper presents a novel Web Usage Mining algorithm-Incremental Web Usage Mining algorithm based on Active Ant Colony Clustering. Firstly, an active movement strategy about direction selection and speed, different with the positive strategy employed by other Ant Colony Clustering algorithms, is proposed to construct an Active Ant Colony Clustering algorithm, which avoid the idle and "flying over the plane" moving phenomenon, effectively improve the quality and speed of clustering on large dataset. Then a mechanism of decomposing clusters based on above methods is introduced to form new clusters when users' interests change. Empirical studies on a real Web dataset show the active ant colony clustering algorithm has better performance than the previous algorithms, and the incremental approach based on the proposed mechanism can efficiently implement incremental Web usage mining. 相似文献
12.
一种基于改进的AprioriAll算法的Web路径模式挖掘 总被引:2,自引:0,他引:2
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。 相似文献
14.
分析了典型的聚类算法及其适用范围,针对其处理Web点击流数据的不足,提出了一种用于Web点击流的增量挖掘的聚类算法WCSCluster,给出了相关定义及存储结构,并用实例说明了算法的运行过程.最后对比同类算法给出实验结果.实验结果表明该算法具有良好的性能,能够发现更优的簇. 相似文献
15.
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息. 相似文献
16.
Web用户访问模式挖掘 总被引:3,自引:0,他引:3
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述. 相似文献
17.
提出了一种新的自适应的检测算法——量子遗传模糊聚类算法(QGFC).该算法利用量子遗传理论,在无监督的条件下,通过模糊聚类的方法对数据集进行自动分类,以达到自主识别入侵行为的目的.实验仿真结果显示,此算法可以有效地对入侵行为进行检测. 相似文献
18.
基于XML的Web数据挖掘技术 总被引:5,自引:0,他引:5
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法. 相似文献