首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
杨斌  纪东升 《甘肃科技》2012,28(18):23-26
随着网络技术和数据库技术的成熟和发展,全球传统商务正经历一次重大变革,向电子商务全速挺进。就此学习研究了数据挖掘和商务智能的相关知识,分析了目前针对电子商务网站数据挖掘的主要研究方向Web日志挖掘,针对基于Web日志处理来获取访客行为数据所存在的不足,对数据挖掘技术在智能商务中的应用进行了分析,将实时在线挖掘与定期人工挖掘相补充的商务客户行为分析技术进行了研究。  相似文献   

2.
网络教育的飞速发展,使得网络学习的效果越来越受到重视.主要介绍了基于Web日志挖掘技术的网络学习行为建模的过程.通过数据收集和预处理、模式发现及模式分析等过程,构建了基于Web日志挖掘的网络学习行为模型.  相似文献   

3.
信息系统收集了大量的业务过程事件日志,过程发现旨在从事件日志中发现过程模型。但面对高度灵活的环境,简单地应用已有的过程发现技术通常会产生不可理解的过程模型(即意大利面模型)问题。轨迹聚类方法允许分解现有的事件日志,从而有效地解决这一问题。现有的轨迹聚类方法有很多,如基于向量空间方法的聚类、基于上下文感知的聚类、基于模型的序列聚类等,通过不同的轨迹聚类方法得到的聚类效果也存在差异。评价聚类效果有很多指标,如基于模型挖掘质量的F-Measure,但已有的聚类评估指标效率低下且操作复杂,不具备简洁性和高效性。本研究提出一种基于日志相似度的轨迹聚类评估方法,通过比较聚类子日志之间的相似程度来衡量聚类日志的质量。通过对仿真事件日志和真实事件日志的实验分析表明,所提出的评估方法为轨迹聚类方法提供了一种良好的参考标准。  相似文献   

4.
Web日志挖掘中数据预处理技术研究   总被引:2,自引:0,他引:2  
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。  相似文献   

5.
文本数据的数据挖掘算法   总被引:11,自引:0,他引:11  
针对目前大量存在的文本数据,以已有的结构化数据挖掘技术为基础,提出了非结构化数据的知识发现方法-树形分层数据库方法,对文本数据进行分析,将非结构化数据准结构化,存放入树形分层数据库中,利用已有的数据库技术以及树形分层数据库特有的一些操作,实现在知识发现过程中对数据的抽取与控制,并给出了具体的模型与过程。  相似文献   

6.
基于蚁群算法的用户导航模式挖掘的研究   总被引:1,自引:0,他引:1  
Web使用挖掘是将数据挖掘技术应用于Web日志数据,从而发现用户行为模式的过程;在电子商务的发展进程中,Web使用挖掘的重要性与日俱增;用户导航模式的挖掘是Web使用挖掘的一个重要研究领域,是优化Web站点框架设计的根本方法;该文首先介绍了用户导航模式挖掘的现状,然后探讨了蚁群算法用于用户导航模式挖掘的可行性,最后对应用的步骤提出了构想。  相似文献   

7.
本文介绍了数据挖掘及Web数据挖掘的含义、Web数据挖掘的分类、过程,阐述了Web数据挖掘技术在网络教学中的应用,并将Web日志挖掘技术运用到实例,采用Apriori算法,分析学生的学习需求趋势。  相似文献   

8.
梁燕红 《科技信息》2011,(22):I0244-I0245
本文介绍了数据挖掘及Web数据挖掘的含义、Web数据挖掘的分类、过程,阐述了Web数据挖掘技术在网络教学中的应用,并将Web日志挖掘技术运用到实例,采用Apriori算法,分析学生的学习需求趋势。  相似文献   

9.
W eb日志挖掘是将数据挖掘技术应用到W eb服务器的日志中,发现web用户的行为模式.在介绍了典型的数据预处理技术的基础之上,指出Fram e页面降低了挖掘结果的兴趣性,并提出相应的解决方法-Fram e页面过滤算法消除其影响.通过实验数据对该算法进行验证,说明Fram e页面过滤算法可以显著地提高W eb日志挖掘结果的兴趣性.  相似文献   

10.
结合实例对商务网站Web日志数据进行挖掘研究,介绍将Web数据转变为数据仓库数据的过程和数据挖掘的方法,文章的最后讲述了可视化数据挖掘技术在表现挖掘结果中的应用.  相似文献   

11.
隐变迁是指一些存在于过程模型中,但没有出现在日志序列中的变迁。这样的变迁会大量存在于现实的模型中。从事件日志中寻找挖掘隐变迁的方法是过程挖掘技术的一个重要的难题。目前针对自由选择网有一些解决办法,但是对于复杂的过程模型有一定的局限性。本文提出了基于Petri网行为轮廓寻找隐变迁的方法。首先根据发生频率最高日志序列得出源模型,再根据剩余的日志序列一步步优化源模型从而找到隐变迁,最后通过评价指标来判定模型的合理性。  相似文献   

12.
数据挖掘是利用各种分析工具在海量数据中发现某些模型和数据间关系的过程。如何根据用户上网日志发现用户感兴趣的信息和资源,帮助网络中心科学地管理和规范其网络用户,已经成为一个迫切的问题。本文通过问题陈述、数据搜集、数据预处理、数据挖掘和结论几个步骤用SPSS软件对某高校某一时段的网络用户上网日志进行分析,为科学的网络管理提供依据。  相似文献   

13.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

14.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.  相似文献   

15.
基于通信行为轮廓的流程挖掘方法对流程进行建模.根据子系统的事件日志,利用已有的挖掘方法挖掘出相应的视图模型;基于系统日志的通信行为轮廓设计出特征网,并将特征网与视图模型进行合并得到开放Petri网;通过映射将其转化为一个流程Petri网模型,通过服从度验证模型的合理性;通过具体的手机充值系统,进行模型挖掘.  相似文献   

16.
Web日志挖掘及AprioriAll算法的改进   总被引:2,自引:0,他引:2  
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.  相似文献   

17.
数据中台是一种利用数据技术为客户提供高效服务的模式.日志是数据中台记录系统运行状态的一种方式,它可以为故障诊断、性能优化、系统安全等任务提供支持,分析日志中的信息对中台日常运维具有重要意义.日志解析是日志挖掘的重要步骤,它将非结构化的日志文本转换为结构化的数据.综述了日志解析算法和评估方法,分析了工业界和学术界的解决方案,总结了日志解析算法的主要类别和特点,比较了不同算法在不同数据集上的性能和效果.发现日志解析算法缺乏统一的标准和数据集,导致结果难以对比和验证.针对这种情况,对未来的研究方向提出建议,应关注建立统一的评估指标和日志数据集,促进工业界和学术界的交流,以提高日志解析算法的适用性和可靠性,对日志解析领域的研究具有参考价值.  相似文献   

18.
上网行为日志数据中包含着大量的用户个性化信息,如何充分挖掘和分析这些信息至关重要。在分析上网行为日志数据的重要性后,提出了一种基于上网行为日志用户画像方法。在该方法中,首先通过特征选择和特征提取方式构建用户特征集,然后利用模型堆叠的技术组合多种单一分类器,构建用户画像模型。利用校园网行为日志数据对性别、年级、年龄三个维度进行用户画像,实验结果表明了所提方法的有效性。  相似文献   

19.
Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。  相似文献   

20.
基于Web的数据挖掘研究   总被引:6,自引:0,他引:6  
基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究主题。本文介绍了Web数据的特点及Web数据挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,并总结了Web日志挖掘的常用数据挖掘技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号