共查询到17条相似文献,搜索用时 78 毫秒
1.
随着互联网的迅速发展,Web数据挖掘的应用越来越广泛。本文主要介绍了Web数据挖掘的定义和分类,介绍了面向XML的Web数据挖掘的特点,并探讨了XML在Web数据挖掘中的应用,包括XML在结构上和内容上的挖掘技术。 相似文献
2.
XML及其在Web数据挖掘中的作用 总被引:1,自引:0,他引:1
汤建超 《五邑大学学报(自然科学版)》2003,17(2):35-38
介绍了Web数据的数据环境和结构,XML简单、开放、扩充的特性及XML与HTML的比较.论述了面向Web的数据挖掘需要解决的问题及XML在Web数据挖掘中所起的作用。 相似文献
3.
目的:解决Web数据挖掘中的半结构化数据模型和半结构化数据模型的抽取问题.方法:运用XML作为元标志语言所提供的描述结构化资料的格式来使复杂的Web数据挖掘简单化.结果与结论:可以加强对非结构化数据如文本数据、图形图像据、多媒体数据的挖掘. 相似文献
4.
基于XML的Web数据挖掘 总被引:4,自引:0,他引:4
介绍了数据挖掘、Web数据挖掘以及XML的基础知识,阐述了将XML技术应用于Web数据挖掘,构建基于XML的Web数据挖掘系统结构. 相似文献
5.
一种基于XML的Web数据挖掘技术 总被引:6,自引:0,他引:6
阐述了一种基于XML的数据抽取技术,并示例如何将该技术应用于Web信息的挖掘,通过对实例的剖析,提出了有关技术人员如何通过该数据挖掘技术拥有一个维护成本低廉而且可靠的数据抽取系统,从而快速便捷地获取所需的信息。 相似文献
6.
本文描述了Web数据不同于传统数据库数据的特点和对其进行数据挖掘的难点,阐明了XML是一种半结构化的数据模型使得它可以应用于Web数据挖掘,介绍了XML应用于Web的理论方法,为Web数据挖掘的理论研究提供了一定的参考作用。 相似文献
7.
8.
基于XML的Web数据挖掘技术 总被引:5,自引:0,他引:5
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法. 相似文献
9.
10.
XML与Web数据挖掘技术 总被引:2,自引:1,他引:2
林建勤 《贵州师范大学学报(自然科学版)》2003,21(2):106-110
数据挖掘技术的核心部分已发展了近十年,研究领域涉及数理统计、人工智能、机器学习等。由于Web数据存在方式的特殊性,使Web数据控制变得十分复杂,XML的出现为解决Web数据挖掘的难题带来了机会。若XML成为具有相互连接特性的因特网标准,那么新一代因特网的关键在于把握XML。因此,研究XML在Web数据挖掘中的应用显得十分重要。文中主要讨论了XML的基本概念及XML在Web数据挖掘中的应用。 相似文献
11.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用. 相似文献
12.
基于XML的WEB数据挖掘系统框架的设计与实现 总被引:9,自引:0,他引:9
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点,而XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合-基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。 相似文献
13.
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。 相似文献
14.
提出使用XML文件的方法存储不同Web日志的格式,采用一个通用的方法分析原始的Web日志,并对日志做预处理、产生Web日志挖掘系统所需的数据,从而使Web日志挖掘更快速和准确。 相似文献
15.
随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘是基于关系数据库和数据仓库的,如何挖掘出XML形式的数据成为研究的热点问题。由于XML文档是一种半结构化数据,使用传统的数据挖掘方法对XML数据进行挖掘是不适用的。提出了一种基于粗糙集理论的XML挖掘模型,并进行了实验,结果表明利用粗糙集理论对XML数据挖掘是可行的。 相似文献
16.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容. 相似文献
17.
Web用户访问模式挖掘 总被引:3,自引:0,他引:3
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述. 相似文献