首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 141 毫秒
1.
文中介绍了Web挖掘的基本概念,提出了一种基于加权关联矩阵聚类的Web日志挖掘算法——多标记传播聚类算法,设计了一个面向电子商务的Web日志挖掘系统模型。  相似文献   

2.
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,首先介绍了Web日志挖掘的过程,然后介绍了关联规则及关联规则算法——FP-growth算法,最后将关联规则中的FP-growth算法应用在网上书店系统中,实现对客户数据的关联规则挖掘。  相似文献   

3.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 .  相似文献   

4.
Web日志挖掘技术应用研究   总被引:11,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

5.
对Web日志进行有效聚类,可得到网站不同访问群和访问模式,研究了Web用户群模糊聚类关键技术.因为Web数据既有定量属性,又有定性属性,对Web用户群的聚类挖掘采用了模糊聚类方法,并设计了基于用户群的页面推荐函数.试验证明,Web用户群模糊聚类挖掘方法是有效的.  相似文献   

6.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

7.
Web日志挖掘及AprioriAll算法的改进   总被引:2,自引:0,他引:2  
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.  相似文献   

8.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。  相似文献   

9.
Web用户聚类研究   总被引:1,自引:0,他引:1  
Web日志数据的海量增长,要求聚类算法能高效的从海量数据中得到满意的用户聚类.本文提出了一种新的聚类算法,在聚类前,利用用户兴趣度对海量数据集进行约简、减小数据计算规模,然后再对Web用户进行聚类.实验证明这种方法能减小数据规模、提高聚类效率,并得到满意的用户聚类.  相似文献   

10.
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。  相似文献   

11.
提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.  相似文献   

12.
不完全信息系统的粗集Web挖掘方法   总被引:1,自引:0,他引:1  
针对电子商务环境下的客户关系管理的特点,提出了基于粗集理论对不完全信息系统的Web挖掘方法.从 已知数据的原始决策表出发,利用基于粗集的Web挖掘方法,选用某种评价算法,以得到决策表及每个数据对象的 决策规则.并结合算例,说明这种Web挖掘方法的使用.  相似文献   

13.
Web日志挖掘改进网站结构的研究   总被引:1,自引:0,他引:1  
Web日志挖掘是目前Web挖掘研究的一个热点课题.针对Web日志挖掘中存在的问题,研究和分析了一个基于网站访问矩阵的路径挖掘算法.在此基础上设计和实现了一个Web日志挖掘系统(WLMS),通过发现用户访问的最优路径和网站访问的统计结果,改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

14.
提出了加权的系统聚类方法.该方法通过对不同的客户特征赋予不同的权重,达到对客户的聚类结果更符合企业经营目标的目的.为分析客户特征的权重,利用线性回归挖掘企业的历史数据,得到物流企业对客户各个特征的重视程度,并把重视程度作为权重进行客户聚类.实验分析表明,与传统的系统聚类相比,加权的系统聚类方法可以发现隐藏在一般客户中的重要客户,从而使物流企业对本公司的重要客户提供优质服务.  相似文献   

15.
根据用户行为模式自动生成动态链接的方法   总被引:2,自引:0,他引:2  
分析了面向用户行为来进行网页动态链的思想方法.提出了处理用户访问网站的日志数据方法,并提出聚类用户的算法思想与步骤,最后分析了每组用户动态生成每组喜欢的链接思想与算法.主要介绍如何预处理用户日志访问数据及对用户聚类.  相似文献   

16.
Immunodominance and clonal selection inspired multiobjective clustering   总被引:1,自引:0,他引:1  
The biological immune system is a highly parallel and distributed adaptive system. The information processing abilities of the immune system provide important insights into the field of computation. Based on immunodominance in the biological immune system and the clonal selection mechanism, a novel data mining method, Immune Dominance Clonal Multiobjective Clustering algorithm (IDCMC), is presented. The algorithm divides an individual population into three sub-populations according to three different measurements, and adopts different evolution and selection strategies for each sub-population. The update of each sub-population, however, is not carried out in isolation. The periodic combination operation of the analysis of the three sub-populations represents considerable advantages in its global search ability. The clustering task is a multiobjective optimization problem, which is more robust with respect to the variety of cluster structures of different datasets than a single-objective clustering algorithm. In addition, the new algorithm can determine the number of clusters automatically, which should identify the most promising clustering solutions in the candidate set. The experimental results, using artificial datasets with different manifold structure and handwritten digit datasets, show that the IDCMC outperforms the PESAII-based clustering method, the genetic algorithm-based clustering technique and the original K-Means algorithm in solving most of the problems tested.  相似文献   

17.
基于数据挖掘方法的中小型企业客户细分的案例研究   总被引:4,自引:0,他引:4  
以中小型商业批发企业为例,基于企业的日常销售数据结合数据挖掘的方法,设计了一种反映客户价值与客户关系质量的客户细分模型,并进行了实际的挖掘。目的是探讨在中小型企业不能提供完备数据的情况下,进行客户细分方法的可行性及有效性。通过分析研究可以看到,只要设计出合理的细分模型仍然可以实现客户细分。  相似文献   

18.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

19.
针对Web的日志记录进行分析,建立一个Web日志挖掘系统.网络管理人员根据Web日志的分析结果改进网站的设计,实现网站的有效管理以保证网络的安全.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号