首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
殷家玉 《科技信息》2009,(18):181-181
本文描述了Web数据不同于传统数据库数据的特点和对其进行数据挖掘的难点,阐明了XML是一种半结构化的数据模型使得它可以应用于Web数据挖掘,介绍了XML应用于Web的理论方法,为Web数据挖掘的理论研究提供了一定的参考作用。  相似文献   

2.
随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘算法是面向关系数据库和数据仓库的,不能直接用于XML文档的数据挖掘。本文从模糊集的基本理论入手,通过定义模糊概念软化属性论域的划分边界,提出了一种面向XML数据的模糊关联规则挖掘方法,并且使用Java语言实现,实验结果证明本文算法是正确的。  相似文献   

3.
Web数据挖掘是将数据挖掘技术和理论应用于对互联网资源挖掘的一门新兴研究领域.XML能够为web数据挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型.  相似文献   

4.
郭冬梅 《科技信息》2011,(3):I0060-I0060,I0068
数据挖掘的技术很多,其中粗糙集理论得到了广泛的应用。粗糙集理论是一种研究不完整、不确定知识处理的数学工具,它可对不完整的数据进行分析和归纳,从中发现知识。本文介绍了数据挖掘基本概念,阐述了粗糙集理论的基本思想,探讨了基于粗糙集理论的数据挖掘方法。  相似文献   

5.
本文研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法。首先对信息系统的数据加工泛化,构造其二进制可辨矩阵。对矩阵进行化简得到属性约简并生成规则。最后,结合银行申请信用卡的实例利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则。  相似文献   

6.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

7.
基于XML的WEB数据挖掘系统框架的设计与实现   总被引:9,自引:0,他引:9  
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点,而XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合-基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。  相似文献   

8.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

9.
本文分析了Web网页的数据挖掘最新技术及发展方向,介绍了基于XML的Web数据挖掘的特点,提出了基于XML的数据抽取技术,最终得到所需的数据并通过一个通用的应用模式进行挖掘的全过程.  相似文献   

10.
用粗糙集进行数据挖掘是近年来被采用的一种新的有效方法 ,本文针对传统粗糙集分类方法过于严格 ,对噪音过分敏感的缺点 ,提出了改进的粗糙集挖掘模式及相应面向属性的约简算法和实现步骤  相似文献   

11.
基于粗糙集的Web日志挖掘研究   总被引:1,自引:1,他引:0  
提出了一种基于粗糙集的Web日志挖掘模型,该模型采用粗糙集的方法对原始数据进行约简,然后应用粗糙集理论对数据进行定性分析和约简.最后结合一个Web日志实例验证了方法的可行性和有效性.  相似文献   

12.
一种基于条件熵的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
粗糙集(Rough set)理论是一个新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的。本文在理解和分析基于粗糙集理论的数据挖掘算法基础上针对属性约简提出了一个基于条件熵的启发式算法。  相似文献   

13.
利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策表训练BP神经网络,再将构造好的BP神经网络集成在每个传感器节点上.仿真结果表明,该算法可以降低数据维数,消除冗余数据、减少网络通信量、延长网络寿命.  相似文献   

14.
不完全信息系统的粗集Web挖掘方法   总被引:1,自引:0,他引:1  
针对电子商务环境下的客户关系管理的特点,提出了基于粗集理论对不完全信息系统的Web挖掘方法.从 已知数据的原始决策表出发,利用基于粗集的Web挖掘方法,选用某种评价算法,以得到决策表及每个数据对象的 决策规则.并结合算例,说明这种Web挖掘方法的使用.  相似文献   

15.
粗糙集理论是一种处理模糊和不确定知识的新型数学工具 ,已广泛应用于人工智能的许多领域特别是数据挖掘和知识发现领域。本文首次将基于粗糙集理论的数据挖掘技术应用于医院院内感染的知识发现 ,在智能诊断的知识自动获取方面取得新的进展。  相似文献   

16.
粗糙集理论及其应用进展   总被引:90,自引:0,他引:90  
粗糙集理论是一种新型的处理模糊和不确定知识的数学工具。目前已在人工智能、知识与数据发现、模式识别与分类、故障检测等方面得到了广泛应用。首先描述了粗糙集的基本算法及其复杂度 ,包括等价关系 ,上下近似及各种约简算法 ;接着对粗糙集扩展理论 ,如可变精度模型 ,相似模型等进行了讨论 ,然后对粗糙集在数据挖掘、大数据集、粗糙逻辑、多方法融合等领域中的应用进展情况进行了论述 ,最后给出了建议的研究方向  相似文献   

17.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

18.
故障诊断规则获取一直都是研究的热点之一。粗集作为分类数据挖掘方法的一种,是故障诊断的一种新的有效方法。首先介绍了基于故障诊断的数据挖掘系统特点及结构,然后介绍各模块功能,并论述了相关的粗集理论及具体算法,最后给出了系统的应用实例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号