首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
一种基于密度的启发性群体智能聚类算法   总被引:3,自引:0,他引:3  
提出一种基于密度的启发性群体智能聚类算法.针对以往群体智能聚类算法中分类错误率较高、算法运行时间较长等不足,提出记忆体方法和基于密度的先行(look ahead)策略.用人工数据集和真实数据集进行实验,将实验结果进行比较分析.分析结果表明,基于密度的启发性群体智能聚类算法能够得到令人满意的聚类结果,其分类错误率和运行时间明显小于其它聚类算法.  相似文献   

2.
基于CORBA的数据集成中间件的设计与实现   总被引:1,自引:0,他引:1  
在研究了国内外异构数据源集成技术的基础上,给出了适合多种异构数据库数据集成的基于CORBA的体系结构、模式集成方法、查询分解算法以及查询优化方法,设计并实现了一个数据集成中间件系统Panorama.Panorama提供了一种研究异构数据集成的实践途径,是一种有效的数据集成工具.  相似文献   

3.
面向通用数据资源,研究聚类数据可视化方法与技术,旨在探索有效的数据处理方法,满足信息领域对高维数据处理的要求。通过对高维数据进行降维处理和可视化映射实现,建立K均值算法的聚类数据挖掘可视化系统模型,实现中间聚簇结果、聚类中心、收敛准则函数值三类要素的可视化。利用加利福利亚大学欧文分校(UCI)数据库中的Iris数据集、Wine数据集、Seeds数据集对可视化系统模型方法进行测试。结果表明,该模型实现了对数据集的有效聚类,能够将中间聚类、聚类中心、收敛准则函数值进行实时有效的可视化表达,达到了预期效果。  相似文献   

4.
近邻传播算法(AP)不需要事先指定聚类数目,在程序运行过程中,能够自动识别聚类中心及聚类数目。在同一批数据集上,AP算法聚类结果稳定,鲁棒性好。除此之外,AP聚类算法可以采用多种距离度量方式,聚类结果精确。针对近邻传播算法(AP)不能对异构数据进行聚类的问题,提出一种基于张量距离的高阶AP聚类算法。该算法首先利用张量表示异构数据对象,然后将张量距离引入AP聚类算法,用来度量异构数据对象在张量空间的相似度。张量距离的引入,不但能够度量异构数据对象在数值上的差异,同时能够度量异构数据对象在高阶空间中位置的差异性,有效的捕捉异构数据对象的分布特征。实验结果表示,提出的高阶AP算法能够有效的对异构数据对象进行聚类。  相似文献   

5.
分析了旅游目的地营销系统(DMS)的数据库现状,探讨了其数据库资源的特点和旅游者、旅游企业对数据集成的需求.通过对不同数据集成方案的比较分析,采用基于Web Ser-vice异构数据集成中间件技术,设计了DMS的异构数据集成中间件,分析该中间件的设计思路与实现流程.阐述了中间件配置管理、查询构造、查询分解、查询执行和重组等模块的设计.该异构数据集成策略,可以使DMS系统数据库与旅游企业自身数据库连接,以实现旅游信息资源的共享.  相似文献   

6.
基于聚类的空间数据挖掘系统的设计与实现   总被引:2,自引:0,他引:2  
空间数据挖掘系统是指从空间数据库中提取隐含数据特征的决策支持系统.本文将采关分析、空间数据挖掘和地理信息系统三者紧密联系起来,并结合土地利用数据库,以聚类的方法对空间数据挖掘系统的设计和实现进行了详细地阐述.  相似文献   

7.
针对当前空间数据库聚类方法未考虑降维后的距离特征反向结果, 导致空间数据分量失真, 存在聚类精度低、 耗时长的问题, 提出一种空间数据库反向最近邻聚类方法. 首先, 通过选取训练样本集实现核矩阵的特征分解, 获得其距离特征修正值去除初始值的影响; 然后, 根据核主成分分析(KPCA)降维并结合降维后的距离特征反向结果, 利用反向最近邻聚类方法与扩展的部分失真搜索法相结合, 实现空间数据的聚类; 最后利用选定的聚类中心对数据集进行计算, 计算数据集第一维分量与聚类中心第一维分量之间的失真, 得到反向最近邻, 直至所有空间数据均找到所属类别, 最终完成空间数据库反向最近邻聚类. 实验结果表明, 该方法提高了空间数据的聚类精度, 减少了空间数据聚类所用时间.  相似文献   

8.
为了解决传统方法不适于大规模用户访问,访问准确性差的问题,通过语义指向性匹配和多维索引树编码结合的方法,对跨境电商系统用户数据库智能访问优化方法进行研究。建立跨境电商数据库模型,为数据库智能访问提供模型依据。依据模糊层次聚类提取语义指向性关联特征,在概念格中完成语义指向性相似度计算,依据提取特征,通过相似度匹配实现数据库智能访问,针对其在用户规模较大时影响访问准确性的问题,采用多维索引树编码的方式对其进行优化,实现对跨境电商系统用户数据库智能访问方法的优化。结果表明:采用所提方法对跨境电商系统时域数据与时频数据语义指向性特征进行提取,能够完成数据语义本体特征指向性聚类,冗余干扰信息被滤除,特征分布聚类性较强;对查全率水平较高情况下的查准率进行测试,发现所提方法在查全率升高时,可令查准率保持在较高的水平,未随查全率的升高有显著下降。可见所提方法访问准确性高。  相似文献   

9.
针对现有大数据空间查询处理方法存在执行时间长和查询结果不够准确的问题,提出一种基于动态分布式聚类算法的大数据查询处理方法,该方法分为数据预处理、数据聚类和查询处理3个部分.首先将输入数据划分为多个子集,以RRD格式存储在一组机器节点中;其次采用划分和层次混合动态聚类算法,在Apache Spark平台上对数据进行分布式...  相似文献   

10.
一种支持结构化P2P的多维范围查找方法   总被引:1,自引:0,他引:1  
提出一种基于结构化P2P的分层聚类查询系统. 利用空间填充曲线建立从高维特征空间到一维相邻空间的映射,根据映射过程提出一种分层聚类的概念,并将相似的多维数据归入在相同的聚类中,使聚类内的数据具有更大的相似性与更小的值域区间. 模拟结果显示,该方法可减少查询所需的带宽,具有良好的查询准确度和可扩展性.  相似文献   

11.
由于数据库系统结构的复杂性,数据库入侵检测比主机和网络入侵检测更复杂,有更多难题需要去解决.该文提出了数据库日志的三种抽象表示法,利用SQL查询结构稳定性,使用序列模式挖掘算法提取角色的序列模式进行数据库入侵检测.同时,考虑到具体数据库系统的应用语义,该文利用数据库系统的聚类函数进行统计相关属性的改变而进行异常检测,两种方法结合起来既考虑了数据库查询结构的稳定性、通用性,又考虑了数据库系统的应用语义,试验结果证明,该综合方法和单一采用这两种方法相比,有较高的准确率,同时有较低的误报率、漏报率.  相似文献   

12.
根据我国两屏三带生态安全战略以及国家公园自然保护地体系建设的具体情况,基于ArcSDE空间数据库引擎关键技术,以湘西州1980-2018年时间段四个年度Landsat-TM遥感影像为基础数据源,结合同类型的生态系统服务多源异构指标数据及统计年鉴相关自然灾害、生态环境和社会经济方面数据,进行空间数据库的图层架构和逻辑结构属性设置,在Visual C#系统中对ArcGIS进行二次开发,建成空间数据库平台。实验结果表明,平台能更好地为各类型生态系统服务查询数据、计算价值,及生态系统服务效应评估与决策支持等利用。  相似文献   

13.
提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍.  相似文献   

14.
基于HBase的分布式空间数据库技术   总被引:1,自引:0,他引:1  
针对在大型地理信息系统(GIS)中, 需要对海量矢量据和栅格数据进行存储并对高并发的用户查询请求提供高效响应, 传统的设计方案难以满足需求的问题, 提出一种使用基于内存存储的分布式数据库HBase存储空间数据, 并设计基于GeoHash的分布式空间索引, 实现了矢量空间数据与栅格空间数据的分布式存储与快速查询. 实验表明, 该方法提升了海量空间数据的查询速度.  相似文献   

15.
利用面向对象的程序设计技术和可视化编程工具建立了面目标微波辐射特性数据库系统,对多种面目标微波辐射特性原始测量数据进行常规的数据库管理,包括动态查询、索引、录入、删除、数据转换和报表输出.并可对查询所得的数据子集进行各种数据处理.  相似文献   

16.
有效的空间数据管理被认为是地理信息系统(简称GIS)的核心.随着技术的进步和实际需要空间数据的管理方法由文件加关系数据库混合管理模式转为对象加关系数据库管理模式.对于一个车辆导航的嵌入式系统而言,需要使用一个基于Internet的连接来下载存储在远端服务器的数据.数据管理以车辆的定位为依据,而车辆的定位是由全球定位系统(GPS)来完成的,还涉及空间查询和地图匹配及其算法等技术.  相似文献   

17.
Recently, attention has been focused on spatial query language which is used to query spatial databases. A design of spatial query language has been presented in this paper by extending the standard relational database query language SQL. It recognizes the significantly different requirements of spatial data handling and overcomes the inherent problems of the application of conventional database query languages. This design is based on an extended spatial data model, including the spatial data types and the spatial operators on them. The processing and optimization of spatial queries have also been discussed in this design. In the end, an implementation of this design is given in a spatial query subsystem.  相似文献   

18.
Recently, attention has been focused on spatial query language which is used to query spatial databases. A design of spatial query language has been presented in this paper by extending the standard relational database query language SQL. It recognizes the significantly different requirements of spatial data handling and overcomes the inherent problems of the application of conventional database query languages. This design is based on an extended spatial data model, including the spatial data types and the spatial operators on them. The processing and optimization of spatial queries have also been discussed in this design. In the end, an implementation of this design is given in a spatial query subsystem.  相似文献   

19.
在确定查询阈值上限时,当前数据库查询方法只能使用查询树的一条路径,并行性能较差;在对超大规模数据进行查询时,具有查询时间长、响应不及时的弊端。为此,提出一种新的阈值上限一定时超大规模数据库的查询方法,通过RSA算法对超大规模数据库进行加密和解密处理,依据多叉树的定义构造多叉索引树,在此基础上计算各代表数据点与查询点之间的距离;在阈值上限一定时,利用多个从节点机并行处理后,使用主节点机汇集结果,运用后续子树递归处理,直至获取查询结果。实验结果表明,所提方法不仅具有很高的查询效率,而且CPU使用率很高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号