首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
采用基于划分的空间聚类方法对地理要素进行聚类时,若仅考虑属性数据,得到与实际空间分布不相符的聚类结果。提出一种考虑空间对象属性特征和空间位置关系的谱聚类方法,首先,计算空间对象的局部离群指数,结合空间格局将样本中的异常点剔除,然后以空间临近为约束条件进行谱聚类分析。以包头地区土壤重金属形态数据为例进行聚类分析,分析结果表明:该方法能够克服谱聚类对初始聚类中心敏感的问题,既能反映属性特征数据的相似程度,又能反映对象的空间分布特性,对空间对象的聚类分析效果优于传统的谱聚类算法。  相似文献   

2.
为了有效地简化稠密采样点模型,提出了一种基于粒子群优化聚类算法的点模型简化方法.引入了具有强大全局寻优能力的粒子群优化算法,对传统的k-均值聚类算法进行改进,基于改进的聚类算法对点模型进行简化,选取具有最优个体适应度函数的粒子作为原始采样点集的最终简化模型.算法聚类依据采样点的空间位置、法向和曲率的邻近性,实现了点模型表面区域几何特征保持的简化.同时在聚类区域的划分中考虑了曲率阈值和区域半径,使得算法在有效地保持特征边界和曲面细节的同时,能够生成高质量的简化曲面.实验结果表明,粒子群优化的k-均值聚类算法克服了传统聚类算法容易陷入局部极小的缺点,具有更好的全局收敛性和较快的收敛速度.该简化方法在有效简化点模型的同时,很好地保持了原始模型的几何形状,且在相同简化效率下能够生成更高质量的简化曲面.  相似文献   

3.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。  相似文献   

4.
基于用户移动行为相似性聚类的Markov位置预测   总被引:1,自引:0,他引:1  
由于采集点丢失或出现新用户等原因,GPS轨迹数据往往具有稀疏性,使得基于单个用户数据的位置预测准确率较低.针对这种情况,提出了基于移动行为相似性和用户聚类的Markov位置预测方法.首先,基于Voronoi图和原始GPS轨迹进行区域划分,位置预测基于区域轨迹进行;其次,提出了同时考虑用户转移特性和用户区域特性的移动行为相似性计算方法;再次,根据移动行为相似性对用户进行聚类,并在聚类的用户组上采用一阶Markov模型进行位置预测,提高了位置预测的准确性.真实GPS轨迹数据上的实验表明了所提出方法的有效性.  相似文献   

5.
针对模糊c均值聚类算法的一些不足之处提出了一种新的均值漂移聚类算法--无监督多尺度聚类算法.该算法不受初始化的影响,不用假定数据的聚类个数以及聚类中心的初始位置,能够利用模糊聚类的方法来获得硬的聚类划分,能够从不同的"划分尺度"揭示数据的聚类结构,并能自动的确定聚类个数.为了满足处理大数据集的需要,设计了快速无监督多尺度模糊聚类算法.通过实验证明无监督多尺度聚类算法在多数数据集上都表现良好且具有最好的总体聚类性能,并能成功揭示出数据的聚类结构.实验还证明快速无监督多尺度模糊聚类算法具有较快的速度和较高的识别精度且适用于大数据集.2个算法都取得了令人满意的实验结果.  相似文献   

6.
应用空间聚类进行点数据分布研究   总被引:2,自引:0,他引:2  
空间数据挖掘是寻找大数据量空间分布的重要方法,应用地理信息系统(GIS)进行空间数据挖掘是目前进行海量数据分析的重要手段之一.应用空间聚类方法对北京市海淀区54 325个企业点数据进行量化分析研究,通过空间位置聚类,进行属性指标量化,从而进行属性指标分层聚类,得到企业空间分布特征.研究表明,空间聚类方法是进行点数据空间分布研究的有效方法.  相似文献   

7.
针对传统K-means算法在初始质心选取的敏感性以及迭代计算的冗余性这两方面的缺陷,提出一种高效的聚类算法(ECA).根据数据对象的空间分布情况,首先采用空间划分预聚类算法(SDPCA)对数据集实现预聚类划分,然后采用基于邻近簇调整的优化聚类算法(OCANC)对预聚类成果进行优化处理,最终获取聚类成果.实验证明,该改进算法能消除对初始输入的敏感性,以更高的运行效率获取较高质量的聚类结果.  相似文献   

8.
子空间聚类能有效的发现各簇与所属于的子空间的联系,同时减少高维数据中因为数据冗余和不相关属性对聚类过程产生的干扰.已有的子空间聚类方法强调各子空间中簇的发现,往往忽略子空间的划分.提出了基于属性最大间隔的子空间聚类,该方法主要思想是对子空间的划分时信息的丢失达到最小,从而子空间聚类的结果的效果比较好.主要工作包括:第一,建立了子空间划分的目标函数,也就是使各划分的子空间相互依赖达到最小,第二,设计了基于属性最大间隔的子空间聚类算法Maximum Margin Subspace Clustering(MMSC)进行子空间聚类集成.最后,采用UCI和NIPS2013比赛等数据来做实验,结果表明,在大多数数据上MMSC算法比其他子空间算法能得到更好的聚类结果.  相似文献   

9.
重庆三峡库区生态功能区划研究   总被引:7,自引:1,他引:6  
生态功能区划是实施区域生态环境保护建设和科学管理的基础.以长江三峡库区(重庆段)沿江区域受库区蓄水影响的23个区县为研究对象,确立能够反映生态功能区划的目的、区域分异规律、区域生态环境特征和范围的指标,采用定量分析(系统聚类方法)和定性分析(图形叠置法)的方法,将重庆三峡库区划分为6大生态功能区.为重庆三峡库区的生态系统管理提供初步的管理框架和尺度范围.  相似文献   

10.
为解决现有基于区域划分的自动制图综合索引方法中层次划分简单固定和没有考虑综合数据的空间分布特点等问题,提出了一种改进的基于区域划分的综合索引方法。该方法的不同之处在于对数据进行了空间聚类和基于缓冲区的冲突探测,将需要综合的空间数据分为四个层次:第一层为整个综合区域;第二层为进行聚类和冲突探测后的区域划分;第三层是利用境界、水系和道路网分割所得的区域划分;第四层是单个目标。实验表明,该方法扩展了索引层次,有效地弥补了原方法的缺点。  相似文献   

11.
从光谱、空间和频域角度,研究了高光谱机载数据CASI在信息提取时所表现的空间尺度效应,基于变航高法获取的数据,对比分析了3种方法对5类典型目标提取的效果,并对信息提取精度进行了定量评价.得到了总体精度评价、5类地物最佳信息提取方法与尺度的确定和3种信息提取方法的针对性等3个结论.成果不仅对于指导数据获取时的航高航速设计具有重要意义,而且对于掌握精细化、定量化、专题化提取某类地物时尺度效应和提取方法的相互关系,都具有重要的参考价值.  相似文献   

12.
人工智能迅速发展,成为国家综合国力不可或缺的组成部分。本研究以“人工智能”为关键词对SCI、EI和SSCI数据库进行检索,以获得的2009~2019年15821篇文章的为研究对象,利用文献计量法和网络分析法对人工智能领域研究文献的空间分布、变化趋势和合作强度进行分析,总结创新主体的科技成果和合作能力。通过对关键词的共词分析、聚类分析和战略坐标图分析法,总结了2009~2019年人工智能研究的热点,潜在发展方向和研究前沿。结果显示:中国人工智能研究文献的数量迅速增长,但我国基于认知层面的核心算法研究水平还亟待提高,这也是未来竞争的核心领域。  相似文献   

13.
时空聚类(spatial-temporal density based spatial clustering of applications with noise,ST-DBSCAN)算法只能处理固定属性的时空数据,且其人为设定阈值的方法具有较大随机性会导致聚类结果不理想.基于ST-DBSCAN算法存在的不足,提出了一种改进的多属性时空聚类算法.改进后的新算法采用绘制时空对象距离频数柱状图来设定自适应阈值,通过引入Gower相似系数、Dice相似系数与欧几里德距离来构建多属性相似度模型,计算多个事务对象之间属性特征的相似度大小,从而将ST-DBSCAN时空聚类算法扩展到更多属性的时空数据聚类分析中.以北京市计算机行业职位招聘信息数据进行实验仿真,实验结果表明,新提出的阈值设定方法可以有效识别部分低密度簇,提高聚类的准确性和有效性;改进后的算法具有较好的普适性与包容性,能对多属性的时空数据进行很好的聚类分析.  相似文献   

14.
为了快速挖掘大规模空间数据的聚集特性,在cluster_dp密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClusterdp.首先,设计一种能平衡工作负载弹性分布数据集分区方法,根据数据在空间的分布情况,自动划分网格并分配数据,使得网格内数据量相对均衡,达到平衡运算节点负载的目的;接着,提出一种适用于并行计算的局部密度定义,并改进聚类中心的计算方式,解决了原始算法需要通过绘制决策图判断聚类中心对象的缺陷;最后,通过网格内及网格间聚簇合并等优化策略,实现了大规模空间数据的快速聚类处理.实验结果表明,借助Spark数据处理平台编程实现算法,本方法可以有效实现大规模空间数据的快速聚类,与传统的密度聚类方法相比具有较高的精确度与更好的系统处理性能.  相似文献   

15.
地籍管理中核心要素宗地的几何空间和属性信息具有典型的时空特性.以往宗地时空变化的研究主要集中在表达宗地的某一方面,对宗地所有属性和几何空间信息时空变化的表达需要加强.同时,移动对象理论在表达宗地时空变化的研究与应用还没有,且在表达多个对象间同步变化时仍需进一步研究.针对这2个问题,分析了宗地时空变化的类型,提出了基于移动点对象的单个宗地几何空间和属性(单一属性和权属)信息时空变化表达方法以及基于事件的多个宗地间时空变化表达方法,并研发了地籍宗地时空管理原型系统,验证了文中提出理论方法的可行性和有效性.  相似文献   

16.
基于Cluster结构的多维动态数据分布方法   总被引:1,自引:0,他引:1  
数据分布是数据库查询并行处理的基础,良好的数据分布方法对查询性能有着重要影响,本文提出了一种新的基于Cluster结构的多维动态数据分布方法,该方法能保证数据均匀分布在多个处理机上;能动态调整数据片段的大小,使关系始终保持最优并行度;并能有效地支持各属性上的查询操作,性能分析及实验结果表明,在大规模的并行系统中,本文方法的性能优于过去的数据分布方法。  相似文献   

17.
针对属性值信息不完全的多属性群决策问题,从聚类分析的角度,提出了一种新的决策方法.该方法首先整理决策信息,形成数据库,然后依据支持方案的不同将数据库中的数据聚类,进而依据支持数据的多少完成对方案的排序.该方法的特点是易于在计算机上实现,并且评价过程相对客观.最后,给出了一个例子验证了方法的有效性.  相似文献   

18.
创新集群微观空间结构分析   总被引:1,自引:0,他引:1  
通过引入探索性空间数据分析方法,聚焦上海杨浦环同济建筑设计产业集群,对其空间形态与集聚性进行了测度.同时着眼于集群内部空间结构分析,对创新集聚性随空间尺度与步长的变化规律进行了探索,并基于其影响因素从水平和垂直两个维度对创新集群网络组织的空间分布规律进行了研究.结果显示:创新集群的空间分布呈现明显的中心-外围模式,这来自于关联效应、知识溢出和其他外部经济所构成的向心力和地租及拥挤效应所产生的离心力两种力场综合交错作用的结果.集群中以同济大学为代表的知识源所形成的"中心",通过知识和信息交流及制度模式创新与强化所形成的地方化特征,使企业在交通网结构约束下,依据产品性质、规模和技术复杂程度的地方化适宜性进行空间决策,是构成创新集群空间组织模式的核心机制.  相似文献   

19.
通过提取数值模拟得到的流线场内质点的空间坐标及属性数据,建立流线簇流量、流线簇潜力和流线簇含油率的油藏流线场表征方法,应用密度峰值算法对流线场进行聚类分级评价,并通过SDbw系数验证划分流线等级的聚类效果,最终形成高含水期油藏流线场定量表征与评价的技术方法。结果表明,利用流线簇流量、流线簇潜力及流线簇含油率等3参数对流线场进行表征较常规方法更能反映注采井间流量及潜力的分布关系和大小,通过表征参数的聚类分级定量确定不同区域的流线强度等级。将流线场表征与评价方法应用于某东部油田实际区块,整个流线场被划分为14类,各区域驱替强度差异较大,通过流线场重构,调整前后流线场等级由14类变为7类,流动非均质性减弱,油藏动用程度明显改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号