期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

数据挖掘技术的核心部分已发展了近十年,研究领域涉及数理统计、人工智能、机器学习等。由于Web数据存在方式的特殊性,使Web数据控制变得十分复杂,XML的出现为解决Web数据挖掘的难题带来了机会。若XML成为具有相互连接特性的因特网标准,那么新一代因特网的关键在于把握XML。因此,研究XML在Web数据挖掘中的应用显得十分重要。文中主要讨论了XML的基本概念及XML在Web数据挖掘中的应用。相似文献

11.

Web挖掘在Web交易中的应用

林苗张广泉《重庆师范大学学报(自然科学版)》2007,24(3):38-41

基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用. 相似文献

12.

基于XML的WEB数据挖掘系统框架的设计与实现 总被引：9，自引：0，他引：9

何波李建国《西南师范大学学报(自然科学版)》2002,27(6):887-890

互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点，而XML正逐渐成为新一代互联网数据组织和交换的事实标准，两者的结合－基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。分析了Web数据挖掘技术的难点，提出了一个基于XML的Web内容数据挖掘系统框架。相似文献

13.

Web访问挖掘中数据预处理的改进

黄志强贾宇波《广西师范大学学报(自然科学版)》2007,25(2):69-73

在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。相似文献

14.

基于XML的Web日志预处理

张建东《许昌师专学报》2008,(2):72-75

提出使用XML文件的方法存储不同Web日志的格式,采用一个通用的方法分析原始的Web日志,并对日志做预处理、产生Web日志挖掘系统所需的数据,从而使Web日志挖掘更快速和准确。相似文献

15.

一种基于粗糙集理论的XML数据挖掘模型

朱兴统《科学技术与工程》2011,11(20)

随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘是基于关系数据库和数据仓库的,如何挖掘出XML形式的数据成为研究的热点问题。由于XML文档是一种半结构化数据,使用传统的数据挖掘方法对XML数据进行挖掘是不适用的。提出了一种基于粗糙集理论的XML挖掘模型,并进行了实验,结果表明利用粗糙集理论对XML数据挖掘是可行的。相似文献

16.

基于XML的Web内容挖掘方法

郑霞陈建国《沈阳大学学报：自然科学版》2012,24(3):52-55

在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型．利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘．实验结果表明,该模型工作良好,可以自动、有效地提取网页内容．相似文献

17.

Web用户访问模式挖掘 总被引：3，自引：0，他引：3

王熙照王丽娟袁方湛燕《河北大学学报(自然科学版)》2002,22(4):404-409

随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述. 相似文献