期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

康耀龙《科技信息》2010,(5):83-83

Web日志挖掘是Web使用挖掘一个最重要研究领域,数据预处理是Web日志挖掘中的关键技术之一。论述了数据预处理各主要步骤的方法和技术,重点研究了用户识别和会话识别。相似文献

2.

黄志强贾宇波《广西师范大学学报(自然科学版)》2007,25(2):69-73

在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。相似文献

3.

Web日志挖掘数据预处理中的会话识别技术

许艳丹《中国西部科技》2011,10(4):28-29,15

会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性。本文分析了Web日志挖掘的数据预处理过程中的三种会话识别算法,最终选用时间阈值法对安徽国防科技职业学院服务器日志文件进行会话识别。相似文献

4.

Web使用记录挖掘前的事务识别方法

胡秦斌李广原《广西师范学院学报(自然科学版)》2007,24(4):97-99

Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法. 相似文献

5.

WEB使用挖掘中的数据预处理分析与算法研究

王晓静张晋《辽宁大学学报(自然科学版)》2009,36(2):157-160

数据预处理是Web使用挖掘的第一阶段,完整的数据预处理过程包括数据净化、用户识别、会话识别、事务识别和路径补充五个环节.在每个环节中,首先给出了详细的过程定义,接着给出了每个环节的数据处理方法或算法,最后指出了未来研究方向. 相似文献

6.

基于web日志挖掘的数据预处理研究 总被引：2，自引：0，他引：2

曹明闪四清《科技资讯》2007,1(4):103-105

Web日志信息的预处理是Web日志挖掘任务中的重要阶段,也是工作量较大的一部分.Web服务器上的数据是半结构化的,而且含有大量和挖掘无关的记录和冗余项.这就需要对其进行处理以得到适合挖掘的数据事务(Transaction)形式.Web日志预处理就是通过一系列的清洗、集成、转换等来得到合适的待挖掘数据.本文重点介绍了数据清理、用户识别、会话识别、路径补充、事务识别等过程. 相似文献

7.

Web使用挖掘中数据预处理算法的设计与实现

李超锋《中南民族大学学报(自然科学版)》2007,26(1):56-60

指出了数据预处理在Web使用挖掘中的重要性,详细分析了Web使用挖掘数据预处理过程,在每个数据预处理的每个阶段给出了一些规则并针对这些规则设计和实现了相应的预处理算法.实验结果证明这些算法是有效的. 相似文献

8.

结合站点拓扑结构的页面视图分析

张琦琪陈俊杰《太原理工大学学报》2004,35(4):414-417

在介绍用途数据挖掘预处理过程的基础上，结合站点的拓扑结构，详细分析了页面视图的识别过程，给出了站点结构的形式化表述和页面视图识别的算法，为Web用途挖掘找到了合适的挖掘粒度。最后总结了结构数据对用途挖掘的作用。相似文献

9.

Web日志挖掘中数据预处理技术研究 总被引：2，自引：0，他引：2

方元康胡学钢夏启寿《安庆师范学院学报(自然科学版)》2008,14(3)

Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。相似文献

10.

Web使用挖掘的数据预处理过程分析

贾瑛《科技信息》2011,(21):I0065-I0066

本问介绍了Web使用挖掘的概念,探讨了数据预处理的流程：数据清洗、用户识别、会话识别、路径补充、事务识别,并分析了每个阶段的目的、方法及结果,给出了每个步骤的实现算法。相似文献

11.

Web日志挖掘中数据预处理方法研究

陈红丽《科学技术与工程》2012,12(8):1928-1930,1935

数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。相似文献

12.

Web日志挖掘中的数据预处理技术 总被引：5，自引：0，他引：5

侯亚丽袁方《河北大学学报(自然科学版)》2005,25(2):202-206

用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统. 相似文献

13.

Web使用挖掘数据源分析 总被引：4，自引：1，他引：4

李超锋《中南民族大学学报(自然科学版)》2005,24(4):82-85

讨论了Web使用挖掘过程的3个步骤,即数据获取与数据预处理、模式发现和模式分析,从服务器端、代理服务器端和客户端3个方面详细分析Web使用挖掘数据源的特征,指出了目前Web使用挖掘的数据源研究存在的不足,并给出了Web使用挖掘的数据源未来的研究方向. 相似文献

14.

基于数据挖掘的网络日志分析

王竝刘钊《苏州大学学报(医学版)》2011,27(2)

日志挖掘是Web数据挖掘的一个重要研究领域.本文首先介绍了Web日志挖掘的方法,然后将Web日志挖掘方法运用于一个学校的网站中,结合Apriori算法对预处理之后的数据进行挖掘,获取页面之间的关联关系,对网站结构的优化提供一定的依据. 相似文献

15.

Web使用挖掘中数据预处理的研究 总被引：1，自引：1，他引：0

田倩飞左源瑞廖鹏《西南师范大学学报(自然科学版)》2008,33(6)

对Web使用挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括数据的来源及清理、用户识别、会话识别、路径补充等步骤及其所采用的技术．在现有Web使用挖掘数据预处理的步骤上提出改进,即在路径补充后,利用最大向前序列法（MFR,Max Forward Reference）进行二次会话识别,克服了原有会话识别中最大向前序列法的缺点．最后给出示例及其结果．相似文献

16.

基于Web日志的数据挖掘的研究及应用

周金枝《科学技术与工程》2010,10(11)

Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,首先介绍了Web日志挖掘的过程,然后介绍了关联规则及关联规则算法——FP-growth算法,最后将关联规则中的FP-growth算法应用在网上书店系统中,实现对客户数据的关联规则挖掘。相似文献

17.

网络教育资源浏览的导航模型及其挖掘算法

黄永青凌海峰梁昌勇《合肥工业大学学报(自然科学版)》2006,29(9):1077-1080

将Web使用挖掘应用到网络教育领域,分析了其挖掘过程,包括数据采集、数据预处理、模式发现和模式分析;通过建立网络教育资源导航模型,并利用蚁群算法对Web日志数据中使用者的浏览行为进行挖掘;提出一个新的导航路径挖掘算法,可以发现有价值的用户浏览模式,指导用户对教育资源作进一步的搜索,还可以将训练好的网络图用于用户的个性化定制服务。相似文献

18.

基于Web使用挖掘的实时聚类算法

邓晶晶蒋玉明傅静涛《四川大学学报(自然科学版)》2007,44(4):803-806

本文讨论了基于Web使用挖掘的Web个性化技术,针对个性化系统的功能及特点,论述了相关数据采集、数据预处理技术和模式发现及其在个性化服务中的应用,提出了一个关于个性化系统的实时聚类算法.实验结果表明,该算法不仅有效,而且具有较高的准确度,能适应用户短期浏览的变化. 相似文献

19.

基于XML的Web日志预处理

张建东《许昌师专学报》2008,(2):72-75

提出使用XML文件的方法存储不同Web日志的格式,采用一个通用的方法分析原始的Web日志,并对日志做预处理、产生Web日志挖掘系统所需的数据,从而使Web日志挖掘更快速和准确。相似文献

20.

基于蚁群算法的用户导航模式挖掘的研究 总被引：1，自引：0，他引：1

凌海峰刘业政杨善林《合肥工业大学学报(自然科学版)》2005,28(8):850-853

Web使用挖掘是将数据挖掘技术应用于Web日志数据,从而发现用户行为模式的过程;在电子商务的发展进程中,Web使用挖掘的重要性与日俱增;用户导航模式的挖掘是Web使用挖掘的一个重要研究领域,是优化Web站点框架设计的根本方法;该文首先介绍了用户导航模式挖掘的现状,然后探讨了蚁群算法用于用户导航模式挖掘的可行性,最后对应用的步骤提出了构想。相似文献