首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于XML的WEB数据挖掘系统框架的设计与实现   总被引:9,自引:0,他引:9  
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点,而XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合-基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。  相似文献   

2.
随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘是基于关系数据库和数据仓库的,如何挖掘出XML形式的数据成为研究的热点问题。由于XML文档是一种半结构化数据,使用传统的数据挖掘方法对XML数据进行挖掘是不适用的。提出了一种基于粗糙集理论的XML挖掘模型,并进行了实验,结果表明利用粗糙集理论对XML数据挖掘是可行的。  相似文献   

3.
给出了一个基于粗糙集的知识规则的挖掘算法系统。系统具有通用性,可以对各个领域内容的数据进行挖掘。挖掘系统理论上不限定条件字段及决策字段的个数,可以对各种离散型的数据进行处理并形成规则库。  相似文献   

4.
给出了一个基于粗糙集的知识规则的挖掘算法系统.系统具有通用性,可以对各个领域内容的数据进行挖掘.挖掘系统理论上不限定条件字段及决策字段的个数,可以对各种离散型的数据进行处理并形成规则库.  相似文献   

5.
Web挖掘技术是将传统的数据挖掘技术与Web技术相结合。本文研究分析了与Web挖掘有关的几个重要问题,并详细论述了web挖掘在个性化搜索引擎中的应用。  相似文献   

6.
Web挖掘技术是将传统的数据挖掘技术与Web技术相结合。本文分析了与Web挖掘有关的几个重要问题,并详细论述了web挖掘在个性化搜索引擎中的应用。  相似文献   

7.
杨光 《科技信息》2009,(10):173-174
当今社会,越来越多的机构、团体和个人在Internet上发布信息、查找信息,因此,Internet已经成为最丰富的信息来源。然而Web相对于有效的数据仓库和数据挖掘而言,Web比较庞大;Web页面相对于任何传统的文本文档也复杂得多;Web面对的是一个广泛形形色色的用户群体和在Web上的信息只有很小的一部分是相关的或有用的等一些问题。解决这些问题的一个途径就是将传统的数据挖掘技术和Web结合起来,进行Web数据挖掘。  相似文献   

8.
随着Web技术的发展,开发电子商务网站成为一种新的营销模式,在保证产品质量的前提下,增加用户的点击率,提高商品销售率是企业提升竞争力的关键。Web挖掘正是应用数据挖掘的方法通过对Web页面内容、页面之间的结构、用户访问的信息等各种数据进行分析和挖掘发现潜在的、有用的知识的过程,帮助决策者更加准确地获得商品的销售信息和客户信息,使客户在短时间内完成商品的浏览、搜索以及订购。  相似文献   

9.
WEB数据挖掘研究与探讨   总被引:2,自引:0,他引:2  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成了数据组织和web相关领域的专家学者关注的焦点.为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域-Web数据挖掘.主要介绍了Web数据挖掘的原理、应用、实现以及它的最近发展情况.  相似文献   

10.
基于专业搜索引擎的元搜索引擎的设计   总被引:1,自引:0,他引:1  
介绍了一个基于专业搜索引擎的元搜索引擎,提出将专业搜索引擎与专门搜索“Invisible Web”检索工具相结合的方法.在对检索结果进行融合处理时,采用建立专业词典的方法来提取主题,并进行主题的分类.同时,通过记录用户感兴趣的主题,为用户提供个性化服务.  相似文献   

11.
故障诊断规则获取一直都是研究的热点之一。粗集作为分类数据挖掘方法的一种,是故障诊断的一种新的有效方法。首先介绍了基于故障诊断的数据挖掘系统特点及结构,然后介绍各模块功能,并论述了相关的粗集理论及具体算法,最后给出了系统的应用实例。  相似文献   

12.
基于WEB的数据挖掘研究综述   总被引:5,自引:0,他引:5  
运用数据挖掘技术进行Web数据挖掘成为数据分析领域中的一个重要研究热点,与传统数据相比较,Web数据具有结构复杂、形式多样与内容广泛等特点,且用户对其需求亦是五花八门的,这对数据分析领域提出了更大的挑战.基于为研究Web数据挖掘提供参考,将Web数据挖掘粗略地分为三类:内容挖掘、结构挖掘和使用挖掘,并分别进行了综述,然后根据当前的应用现状分析了这一研究领域的几个研究方向.  相似文献   

13.
讨论了智能专题搜索引擎的相关设计和实现,通过信息搜索技术、自然语言理解技术、语义网络技术以及数据挖掘技术的引入,改进了传统搜索引擎的搜索结构,进而采用这些技术实现了一个专题搜索的实例。  相似文献   

14.
提出了两种新的约减算法,分别运用遗传算法和Best-First搜索方法求约减集,前者利用了遗传算法的寻优特性从种群中获得一最优及一组次优个体,进而获得一组约减;后者采用Best-First搜索方法,相对于A算法可扩大搜索空间,并可从open表前部获得一最优及一组次优的状态节点,进而获得一组约减。实验结果表明,文中提出的算法是有效且合理的。  相似文献   

15.
Internet数据挖掘原理及实现   总被引:5,自引:1,他引:5  
分析了Internet数据挖掘的特点、目标及其原理,重点探讨了文本知识挖掘及其CVSM模型、搜索引擎数据挖掘及其OEM模型及基于Intranet的多软件机器人体系结构和基于Agent的个性化检索,最后指出了Internet数据挖掘的发展方向。  相似文献   

16.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

17.
用粗糙集进行数据挖掘是近年来被采用的一种新的有效方法 ,本文针对传统粗糙集分类方法过于严格 ,对噪音过分敏感的缺点 ,提出了改进的粗糙集挖掘模式及相应面向属性的约简算法和实现步骤  相似文献   

18.
Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点.提出一个具有良好发展前景的基于Web进行数据挖掘的模型,并详细阐述了该模型的结构和工作机理.  相似文献   

19.
基于粗糙集数据挖掘技术开发的用水量计划系统   总被引:1,自引:0,他引:1  
面向粗糙集的数据挖掘方法能有效地从某些不精确信息集合中发现知识,而现实中这种数据是广泛存在的,因此这种方法具有很强的实用价值。结合从粗糙集中发现的规则算法Apriori—2开发了一个小型用水量计划系统,并对系统的设计及测试分析过程进行了简要的介绍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号