共查询到17条相似文献,搜索用时 406 毫秒
1.
李超锋 《中南民族大学学报(自然科学版)》2007,26(1):56-60
指出了数据预处理在Web使用挖掘中的重要性,详细分析了Web使用挖掘数据预处理过程,在每个数据预处理的每个阶段给出了一些规则并针对这些规则设计和实现了相应的预处理算法.实验结果证明这些算法是有效的. 相似文献
2.
本问介绍了Web使用挖掘的概念,探讨了数据预处理的流程:数据清洗、用户识别、会话识别、路径补充、事务识别,并分析了每个阶段的目的、方法及结果,给出了每个步骤的实现算法。 相似文献
3.
一个简单的Web日志挖掘系统 总被引:22,自引:0,他引:22
在分析Web日志挖掘的困难及对策的基础上,给出了一个简单的Web日志挖掘系统(SWLMS)的体系结构,具体介绍了SWLMS中日志的预处理过程,包括数据净倾、用户识别、会话识别、路径补充的主要任务及其实现,并着重介绍了预处理之后的序列模式识别过程和算法,包括最大向前路径的识别和频繁遍历路径的发现,并给出了实验结果。 相似文献
4.
Web使用挖掘中数据预处理的研究 总被引:1,自引:1,他引:0
对Web使用挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括数据的来源及清理、用户识别、会话识别、路径补充等步骤及其所采用的技术.在现有Web使用挖掘数据预处理的步骤上提出改进,即在路径补充后,利用最大向前序列法(MFR,Max Forward Reference)进行二次会话识别,克服了原有会话识别中最大向前序列法的缺点.最后给出示例及其结果. 相似文献
5.
基于web日志挖掘的数据预处理研究 总被引:2,自引:0,他引:2
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,也是工作量较大的一部分.Web服务器上的数据是半结构化的,而且含有大量和挖掘无关的记录和冗余项.这就需要对其进行处理以得到适合挖掘的数据事务(Transaction)形式.Web日志预处理就是通过一系列的清洗、集成、转换等来得到合适的待挖掘数据.本文重点介绍了数据清理、用户识别、会话识别、路径补充、事务识别等过程. 相似文献
6.
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。 相似文献
7.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法. 相似文献
8.
Web日志挖掘中的数据预处理技术 总被引:5,自引:0,他引:5
用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统. 相似文献
9.
Web使用挖掘是当前的一个热点研究方向,数据预处理是Web使用挖掘过程中的一个重要阶段。讨论了数据预处理技术中网络拓扑结构用户识别算法和会话识别启发算法的主要应用,并就其将来发展方向作了简单预测。 相似文献
10.
Web使用挖掘数据源分析 总被引:4,自引:1,他引:4
李超锋 《中南民族大学学报(自然科学版)》2005,24(4):82-85
讨论了Web使用挖掘过程的3个步骤,即数据获取与数据预处理、模式发现和模式分析,从服务器端、代理服务器端和客户端3个方面详细分析Web使用挖掘数据源的特征,指出了目前Web使用挖掘的数据源研究存在的不足,并给出了Web使用挖掘的数据源未来的研究方向. 相似文献
11.
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。 文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。 相似文献
12.
Web日志挖掘是Web使用挖掘一个最重要研究领域,数据预处理是Web日志挖掘中的关键技术之一。论述了数据预处理各主要步骤的方法和技术,重点研究了用户识别和会话识别。 相似文献
13.
涂承胜 《重庆三峡学院学报》2005,21(3):14-18
本文简要介绍了WEB挖掘的基本概念及其分类,讨论了Web使用挖掘的有关理论.重点分析了Web使用挖掘的主要研究对象和研究方法,包括挖掘的数据对象、数据的采集、数据预处理、模式发现、模式分析及其相关技术. 相似文献
14.
刘耀南 《佛山科学技术学院学报(自然科学版)》2012,30(3):70-74
关联规则是数据挖掘领域中最重要的研究内容,能够在数据库中发现频繁模式和关联知识。对关联规则及其相关挖掘算法Apriori进行了分析,指出了Apriori算法存在的缺点。通过基于预处理的改进Apriori算法在高校教学评价中的应用,说明数据挖掘过程,分析挖掘结果,最后指出了未来的研究方向。 相似文献
15.
Web日志挖掘中数据预处理技术研究 总被引:2,自引:0,他引:2
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。 相似文献
16.
供应链管理中的数据预处理技术 总被引:1,自引:0,他引:1
数据挖掘技术在供应链管理中起着非常重要的作用,由于数据常常出现噪声、缺失等情况,因此数据预处理成为数据挖掘过程中非常重要的一个步骤。结合供应链管理中的数据挖掘对各种数据预处理技术进行了介绍,并讨论了适合在供应链管理数据挖掘中应用的数据预处理技术。 相似文献
17.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势. 相似文献