首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
函数依赖是关系数据库和数据建模中所需的关键约束知识。在海量数据中挖掘函数依赖时为降低噪音干扰和提高效率,该文采用带有满意度函数依赖的概念及挖掘带有满意度函数依赖的算法(MFDD),对噪音进行测度与表达,并有效挖掘得到函数依赖最小集。利用对属性散列度的测度概念,在带有满意度函数依赖的理论框架内采用3条优化策略,实现了属性预扫描算法。结果表明:基于该算法可显著提高挖掘效率。  相似文献   

2.
针对函数依赖一致性数据生成问题,采用有向无环图作为函数依赖集合的描述模型,提出一种单函数依赖一致性数据生成算法 (TGSFD);并通过属性排序解决多函数依赖一致性数据生成问题;为了利用流水线技术提高数据生成效率,提出最小独立属性子集概念,并给出了属性集划分算法. 实验表明本文提出的TGSFD和属性排序算法能够保证生成的数据满足函数依赖一致性,属性集划分和流水线技术可以有效提高数据生成效率.   相似文献   

3.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

4.
属性约简是模糊粗糙集理论的重要研究内容.本文引进了基于距离的模糊相似关系,建立了距离测度下的模糊粗糙模型,从而得到条件属性和决策属性之间的依赖函数,通过此函数构造了前向搜索属性约简算法.并利用了UCI标准数据集与现有算法进行比较,从而验证了该算法的可行性和有效性.  相似文献   

5.
批处理依赖是一种特殊的函数依赖,但其定义的推理规则过于严格而不适用于含噪数据.为了从含噪数据中挖掘出有价值的批处理依赖,在批处理依赖研究的基础上,提出了近似批处理依赖的概念,并通过引入可信度、特异度等度量指标,提出了相应的近似批处理依赖挖掘算法;最后通过实例说明了算法过程及其有效性.  相似文献   

6.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

7.
给出了一个函数依赖概念的推广,提出了函数依赖作用域的概念,讨论并证明了作用域的性质,基于函数依赖的作用域提出了一种分类规则的挖掘算法,并用实例证明了该算法的有效性.  相似文献   

8.
基于测度的网格聚类算法   总被引:1,自引:0,他引:1  
基于测度的网格聚类方法在数据空间上定义计数测度,并以计数测度构造目标函数.通过调整划分数据空间的分辨率,使目标函数值最大,从而实现分辨率的自动确定.在此分辨率下,某些数据细节被忽略,但是数据的主要属性和关系更为明显.距离较近的数据将被聚类到属性相同的同一簇中,使簇间的数据相似性最小,簇内的数据相似性最大.算法中没有对参数值进行人为设定,可以实现提高准确性的目的.  相似文献   

9.
介绍了粗糙集理论实现数据分类和规则推理的基本原理,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不相容规则的决策系统的多层次数据挖掘算法,应用一实际的例子说明如何在数据库中发现分类规则.  相似文献   

10.
数据库设计和管理工具中,从已知数据库发现函数依赖是一个重要的技术。本文基于自由集的概念,讨论了最小函数依赖(FDs)的一个新特性和相关重要性质,并给出一个有效的最小函数依赖挖掘算法。  相似文献   

11.
用模糊关系数据模型来描述不分明的模糊数据是关系数据库理论发展中的一个重要的新课题。本文用模糊等价关系及其隶属函数来描述模糊函数依赖与多值依赖,看出经典数据依赖是模糊数据依赖的特例。并且证明相应于Armstrong公理的一套模糊数据依赖的推理规则是正确、完备的。  相似文献   

12.
约束数据模型作为一种新的数据模型正受到广泛关注。为了约束数据库的应用,需要研究它的设计。为此本文对约束数据库中的函数依赖给出定义,并提出函数依赖的公理系统,证明了它的有效性和完备性;在此基础上完成了约束数据库设计的核心工作:把约束关系模式分解为3NF或BCNF的算法。  相似文献   

13.
基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条件值下的数据一致性问题并提供可用于一致性修复的参考值.同时,提出了一种一致性修复的代价模型.模型参考内容相关的条件函数依赖对应元组的实际情况进行修复,实现代价最优,同时保证数据一致性.通过在两组真实数据集上进行试验测试,证明提出的基于内容相关的条件函数依赖的一致性清洗方法能够准确地检测数据的一致性问题并加以修复.  相似文献   

14.
从分析面向对象数据库中的数据依赖着手,提出对象函数依赖概念,它反映了面向对象数据库中对象标识符,复杂对象及集合类型的特点,在对象函数依赖基础上,提出了分解为基础为模式规范化方法,并且特别引入语义相关集的概念,最后,给出类模式分解的形式化定义并证明了类模式的任一分解都是无损分解。  相似文献   

15.
XML函数依赖     
函数依赖在关系数据库中起着基本的作用,尤其是用在完整性约束和数据库设计方面。近年来已定义了XML上的函数依赖。本文采用了一种新的定义方式,即在树元组上定义函数依赖,同时给出了函数依赖的推理规则。  相似文献   

16.
用模糊关系数据模型来描述不分明的模糊数据是关系数据库理论发展中的一个重要的新课题,本文从模糊连接依赖的定义出发讨论了模糊连接依赖间的蕴含问题,得出了与经典关系模型平行的一系列结论,使模糊数据依赖理论更加完善  相似文献   

17.
基于提出的Vague关系数据模型和Vague集之间的相似度量,研究了Vague关系数据库中的数据依赖问题,给出了Vague函数依赖(VFDs)和Vague多值依赖(VMVDs)的定义及其相应的推理规则.该规则类似于经典关系数据库中函数依赖和多值依赖的Armstrong公理系统,称之为Vague公理系统.并对Vague公理系统的有效性和完备性进行了证明.同时还给出了VFDs满意度的概念及计算VFDs满意度的公式.  相似文献   

18.
Fast Computation of Sparse Data Cubes with Constraints   总被引:2,自引:0,他引:2  
For a data cube there are always constraints between dimensions or among attributes in a dimension,such as functional dependencies.We introduce the problem that when there are functional dependencies,how to use them to speed up the computation of sparse data cubes.A new algorithm CFD (Computation by Functional Dependencies) is presented to satisfy this demand.CFD determines the order of dimensions by considering cardinalities of dimensions and functional dependencies between dimensions together,thus reduce the number of partitions for such dimensions.CFD also combines partitioning from bottom to up and aggregate computation from top to bottom to speed up the computation further.CFD can efficiently compute a data cube with hierarchies in a di-mension from the smallest granularity to the coarsest one.  相似文献   

19.
XML的函数依赖   总被引:1,自引:0,他引:1  
为了表达引起数据冗余的XML函数依赖,研究了XML中存在的复杂的多种形式的函数依赖约束,提出了一种DTD的路径语言,对于导航和定位XML文档的内容具有较强的表达能力.提出了一套XML模式及文档的形式化描述方法,进而提出了一种XML函数依赖(XFD)的定义.与以前的XML函数依赖的定义进行比较,展示了XFD可以表达更多的XML上存在的函数依赖,可以概括以前的基于路径表达式定义的XML函数依赖的约束能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号