首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
例外挖掘是一项有趣的知识发现任务。现有的例外挖掘算法主要基于数据的所有属性检测数据集中的例外。本文针对高维数据的稀疏性,提出了连续数据上基于贝叶斯网(BN)子空间例外挖掘,以及基于属性重要性的连续数据离散化方法。  相似文献   

2.
基于图的空间例外检测算法研究   总被引:5,自引:2,他引:3  
 空间例外检测可以发现许多意想不到的潜在知识.已有的空间例外检测算法都是在多维几何数据集合中进行的文章在图结构数据集合中发现空间例外.首先,结合空间数据的特点并基于DB(ρ,d)例外的定义提供了基于相异度的空间例外SDB(ρ,d)例外的形式化定义,然后给出了相应的空间例外挖掘算法.  相似文献   

3.
一种基于面包含关系的GML空间离群面检测算法   总被引:2,自引:0,他引:2  
为了研究基于空间拓扑关系的离群检测,提出了一种基于面包含关系的离群面检测算法DOR_IR.它采用算法PLI判断面包含关系,并把面包含的对象看作面对象的属性,建立面对象的密度连通集合,相应于"噪音"的面就是离群面.运用算法DOR-IR分别在人工数据集和真实数据集上进行了测试,实验结果表明,算法DOR_IR能有效挖掘基于拓扑包含关系的离群面.  相似文献   

4.
针对分类数据,基于属性分组技术和多目标聚类质量函数,提出一种子空间聚类算法.该算法采用属性分组技术,将高相关属性划分到同属性组中,利用同组属性相关性度量属性权重值,构建属性软子空间;采用基于多目标的聚类质量函数,判断整体聚类效果,通过迭代优化簇集结构,达到最佳的数据划分状态.在人工合成数据集和UCI数据集上,实验验证了该算法的正确性、高效性和可靠性.  相似文献   

5.
文章在分析前人算法不足的基础上,提出了一种改进的挖掘多数据库中例外模式和高选票模式的算法,算法分析结果表明改进的算法能更加准确有效地在多数据库中挖掘出潜在的例外模式和高选票模式.  相似文献   

6.
例外模式挖掘是数据挖掘的一项重要内容.该文针对用户的兴趣提出一种多数据库中例外模式的挖掘方法,先由用户给定他感兴趣的数据对象,选择与用户兴趣相关的数据,局部分析每一个数据库得到局部模式,再将局部模式综合得到全局模式,最终得到例外模式;并用实验验证了该方法的正确性和有效性.  相似文献   

7.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

8.
用概率的形式表示集合的上下近似空间,在对概率近似空间下的统计信息进行缺省规则的挖掘过程中引入ID3算法,根据属性相对于属性集的信息增益确定属性权重,进而确定规则支持度,最终利用规则相似度对挖掘的缺省规则进行合理分类,达到了很好挖掘效果.  相似文献   

9.
提出一种从时间序列数据中辨识例外模式的系统化方法,包括4个步骤1)将时间序列数据分割为一系列子序列;2)将这些子序列映射到某个特征空间;3)在此特征空间中,用聚类算法将分割得到的子序列聚类为不同的模式;4)定义例外支持的概念,并计算每个模式的例外支持,如果某个模式的例外支持小于1,则该模式是一个例外模式。实验表明该方法能够有效地监测出时间序列中的例外模式。  相似文献   

10.
基于属性相关性分析的子空间搜索算法   总被引:1,自引:0,他引:1  
在高维子空间聚类算法中,子空间识别质量有助于改善算法性能.提出了基于属性相关性分析的子空间搜索算法,利用相对熵去除冗余属性,根据联合基尼值判断两两非冗余属性之间的相关性,形成属性关系图,并在此属性关系图上搜索相似兴趣子空间.实验结果表明算法参数容易设置,有较好的子空间识别能力.  相似文献   

11.
面向空间数据组织的地理空间剖分框架性质分析   总被引:1,自引:0,他引:1  
为有效组织与管理海量空间数据,在融合国内外各种球面剖分模型优点基础上,设计了一套集空间数据组织与空间对象表达于一体的多层级地理空间剖分框架——基于地图分幅拓展的全球剖分模型(EMD模型)。在明确EMD模型的构建方法与编码方法基础上,对EMD框架方案进行了数学定义,并具体分析了其几何性质与几何精度,以确定EMD模型的应用领域与应用范围。最后利用GeoID编码完成空间对象表达实验,验证了该地理空间网格框架作为空间对象表达框架的优越性。  相似文献   

12.
For spatial based decision making such as choice of best place to construct a new department store, spatial data warehousing system is required more and more previous spatial data warehousing systems; however, provided decision making of nonspatial data on a map and so those cannot support enough spatial based decision making. The spatial aggregations are proposed for spatial based decision making in spatial data warehouses. The meaning of aggregation operators for applying spatial data was modified and new spatial aggregations were defined. These aggregations can support hierarchical concept of spatial measure. Using these aggregations, the spatial analysis classified by nonspatial data is provided. In case study, how to use these aggregations and how to support spatial based decision making are shown.  相似文献   

13.
For spatial based decision making such as choice of best place to construct a new department store, spatial data warehousing system is required more and more previous spatial data warehousing systems; however, provided decision making of non-spatial data on a map and so those cannot support enough spatial based decision making. The spatial aggregations are proposed for spatial based decision making in spatial data warehouses. The meaning of aggregation operators for applying spatial data was modified and new spatial aggregations were defined. These aggregations can support hierarchical concept of spatial measure. Using these aggregations, the spatial analysis classified by non-spatial data is provided. In case study, how to use these aggregations and how to support spatial based decision making are shown.  相似文献   

14.
地图图形结构分析与概括研究   总被引:2,自引:0,他引:2  
地图图形往往具有一定程度的空间结构特征,例如树枝状水系,棋盘状街道网等。这些空间结构特征深刻反映了地理现象的特点和规律,是地图图形概括过程中需要突出表现的内容。然而,地理数据库中并没有直接存储图形结构信息,而是隐含地表示于几何图形要素的空间关系之中。这就要求在地图概括处理之前进行图形结构分析。分析了地图图形结构模式及其识别过程,并且探讨了图形结构的概括方法。  相似文献   

15.
Most of spatial phenomena like natural vegetation units and land use areas constantly change over time and have uncertainty spatial extents. Till now, a considerable number of data models have been proposed for spatial objects with sharp boundaries as well as with indeterminate boundaries. However, they mainly concern space and time or space and fuzziness and not yet integrate them into a single unified framework. This paper introduces a formal definition of the conceptual fuzzy spatiotemporal data model, called FSTDM for fuzzy regions based on fuzzy set theory. We also contribute a method of manipulating queries with the presence of both temporal predicate and fuzzy spatial predicate in the condition clause efficiently. We then implement a prototype system. Through the experimental results, we prove that our work can be used to build a specialized system such as GIS, spatial database, and so on.  相似文献   

16.
Most of spatial phenomena like natural vegetation units and land use areas constantly change over time and have uncertainty spatial extents. Till now, a considerable number of data models have been proposed for spatial objects with sharp boundaries as well as with indeterminate boundaries. However, they mainly concern space and time or space and fuzziness and not yet integrate them into a single unified framework. This paper introduces a formal definition of the conceptual fuzzy spatiotemporal data model, called FSTDM for fuzzy regions based on fuzzy set theory. We also contribute a method of manipulating queries with the presence of both temporal predicate and fuzzy spatial predicate in the condition clause efficiently. We then implement a prototype system.Through the experimental results, we prove that our work can be used to build a specialized system such as GIS, spatial database, and so on.  相似文献   

17.
基于一阶导数方法,对空间混合自回归模型进行局部影响分析.当模型中误差向量的均值发生扰动时,依据极大似然方法对模型中自回归系数ρ和方差σ2分别构造了检测强影响点或异常点的最大影响方向dmax,ρ和dmax,σ2.数据模拟研究表明,基于dmax,σ2的检测效果明显优于dmax,ρ的效果.同时,对一个实际数据的分析,说明所得结果在实际研究中也是有用的.  相似文献   

18.
通过分析Shapefile的格式,设计了在RDBMS上存储和管理空间数据的空间信息表的结构,既保留了所有的空间信息,又保证了空间数据和属性数据在修改时的一致性.实现了对空间数据完全基于关系数据库的可视化编辑,使将空间数据导入关系数据库的管理更有意义.  相似文献   

19.
针对数据集的聚类过程容易受到离群值的影响这一问题,提出了局部密度离群值检测k-means算法,即先对数据集使用局部密度离群值检测方法检测离群值,先把离群值去除,再进行k-means聚类,算法的有效性通过Davies-Bouldin指标(DB)、Dunn指标和Silhouette指标进行评价,在人工生成的数据集与UCI数据集上验证,去除离群值,再使用k-means算法得到的聚类结果相比原始数据集进行k-means算法聚类结果较好,并且用在疫情数据分析上,对安徽省、北京市、福建省、广东省等24个省、市、自治区2020年2月18日新型冠状病毒肺炎确诊人数进行聚类分析,得到的去除离群值在使用k-means算法相比原始数据集进行k-means算法聚类结果较好,该结果能帮助更好地在实际中怎么去做决策以及更好地降低经济损失。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号