首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
对基于空间聚类的R-树的空间数据库索引技术进行研究,提出了面向R-树的空间混合聚类算法的改进算法,而将改进后的算法与其他算法的性能进行对比,可以发现:改进后的算法比其他空间聚类算法具有更大的优势.  相似文献   

2.
提出一种新的多类标分类算法——多类标聚类树算法.该算法利用文本属性特征及类标信息,通过迭代调用"基于类标信息的聚类算法",将两空间分类树的生长不断划分,直至空间足够简单为止.实验证明,提出的多类标聚类树算法总体上优于其他对比算法,其分类能力强于排序能力.  相似文献   

3.
一种基于相交关系的GML空间聚类算法   总被引:1,自引:0,他引:1  
提出一种基于相交关系的GML空间聚类算法SCIR,该算法以GML数据作为数据源,计算空间对象的相交关系,针对空间对象的相交关系和非空间属性,定义了一种相似度度量方法,利用ROCK算法进行聚类.实验结果表明,算法SCIR能实现GML数据中基于相交关系的空间对象聚类,并具有较高的效率.  相似文献   

4.
一种面向GIS的静态R-树数据组织方法   总被引:2,自引:0,他引:2  
针对GIS空间数据提出了一种基于空间聚类的静态R-树生成方法.该方法用典型点法进行静态R-树数据组织,用空间对象的最小约束矩形代替空间对象本身进行空间聚类计算,形成若干聚类,并以R-树的构建规则进行适当调整,同时通过改进R-树的一些性能指标如覆盖区域、重叠面积和边界周长等提高其查询性能.通过将该算法与其他静态R-树算法如Low x算法、Hilbert R-树算法进行比较,论证了该算法的可行性.  相似文献   

5.
为解决带标号的有根无序树的数据库的索引问题,提出一种新的索引方法,首先挖掘频繁子树,并从中挑选出有判别力的子树作为索引属性,然后将索引属性集合中的子树转换成序列,并将索引组织成前缀树的形式.给出了在此类索引树中进行搜索的算法,并用Apriori剪枝和最大的有判别力的子树来减小搜索空间.实验结果表明:与其他基于路径的索引方法相比,这种基于频繁子树的数据库索引在索引大小和查询代价两方面都有较好的优越性.  相似文献   

6.
在几种流行的推荐算法的基础上,本文提出了一种新的融合用户聚类和关联规则的算法来改善推荐效果。该算法在经典的关联规则算法Apriori基础上引入多最小支持度的概念,并在关联规则算法之前进行用户聚类,在聚类算法中使用了包含字符属性的混合属性距离函数,提高聚类效果。在此算法的基础上,设计并实现了一种新的基于图书馆的推荐系统。实验证明该算法改善了数字图书馆中新书的推荐质量,去除了部分只含高浏览量图书的无意义规则,并趋向于发现相近种类图书的关联性。  相似文献   

7.
基于网格和密度的随机样例的聚类算法   总被引:2,自引:0,他引:2  
为提高密度聚类算法效率并处理非空间属性约束,提出了基于网格和密度的聚类算法(GDRS).它使用网格区域表示点的邻域,非空间属性被分为数值和字符类型.首先通过网格方法找到能准确反映数据空间几何特征的参考点;然后随机选择没有分类的参考点,并测试其邻域的稀疏状况、与其他聚类的关系以及非空间属性的约束来决定加入、合并聚类或形成新的聚类;最后把参考点映射回数据.把此算法和DBSCAN及DBRS算法进行了理论比较,并使用合成和真实数据集对GDRS和DBSCAN进行了对比.实验表明,GDRS具有密度算法的优点,即可发现各种形状的聚类并能屏蔽噪声点,且执行效率明显优于密度算法.  相似文献   

8.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

9.
基于混合聚类算法的动态R-树   总被引:1,自引:0,他引:1  
针对动态R-树是通过动态插入算法建立起来的, 其节点分裂算法的性能直接影响到R-树的性能和查询效率的问题, 为了使动态R-树适应多维复杂空间数据的要求, 提出一种用于实现R-树节点分裂的混合聚类算法(HCR), 它建立在普通聚类算法的基础上, 并进行了一系列扩充. 针对空间对象的均匀分布与不均匀分布, HCR算法在实现R-树节点分裂时分别采用不同的聚类准则以提高其聚类效果和查询效率. 此外, 还将HCR算法与其他算法进行对比实验, 结果表明该算法具有较高的查询效率.  相似文献   

10.
一种新的模糊C均值聚类算法   总被引:1,自引:1,他引:0  
传统的模糊C均值聚类算法及其变型在聚类过程中都假设所有的属性对聚类贡献相同,所以很难发现隐藏在部分属性中的类结构,也难以识别出重要属性.在实际应用中,噪声属性较为常见,并且会影响正常的聚类过程.鉴于以上原因,提出了一种新的基于属性加权的模糊C均值聚类算法,通过对人工数据和实际数据的聚类测试结果,证实了该算法的有效性.  相似文献   

11.
Conceptual clustering is mainly used for solving the deficiency and incompleteness of domain knowledge. Based on conceptual clustering technology and aiming at theinstitutional framework and characteristic of Web theme informauon, this paper proposes and implements dynamic conceptual clustering algorithm and merging algorithm for Web documents, and also analyses the super performance of the clustering algorithm in efficiency and clustering accuracy.  相似文献   

12.
基于双数组Trie树中文分词研究   总被引:1,自引:0,他引:1  
对双数组Trie树(Double—ArrayTrie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个中文分词系统,并与其他几种分词方法进行对比,结果表明,优化后的双数组Trie树插入速度和空间利用率得到了很大提高,且分词查询效率也得到了提高.  相似文献   

13.
基于概念分组的Web搜索结果聚类算法   总被引:2,自引:0,他引:2  
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解.  相似文献   

14.
针对数据挖掘在网络游戏中的应用,提出了游戏访问模式挖掘的概念,并给出一种适用于挖掘游戏访问模式的Apriori_Trie_GAPM算法.该算法基于Apriori算法思想,采用Trie树生成并存储频繁项集,在支持度计算中结合了游戏使用时间.  相似文献   

15.
通过对前缀过滤器特点的分析和观察,依据定位代码结合空间分解技术,设计了基于四分支trie的快速多维数据包分类算法,将数据包和过滤器的匹配通过多维空间中点的定位过程来实现,具有较好的时间和空间复杂度,便于硬件实现。  相似文献   

16.
分析基于前缀长度的二分路由查找算法和基于Trie的路由查找算法的优缺点,在此基础上提出一个改进的路由查找算法,并给出其在IPv6下的实现方案.由于基于前缀长度的二分路由查找算法扩展性好、查找速度快,而基于Trie的路由查找算法实现灵活、转发表动态更新快,这使得所提算法具备路由转发表动态更新快、查找速度快、对前缀长度扩展性好等优点.模拟实验表明该算法能够较好地满足IPv6的要求.  相似文献   

17.
分布式路由器中的路由管理模型   总被引:2,自引:0,他引:2  
高性能分布式路由器中 ,路由管理必须面对两个技术难点 :1)实现高性能的路由查找算法 ;2 )实现主从路由表同步。该文提出一种分布式的路由管理模型 ,给出了这两个技术难点的解决方案。模型实现了路径压缩 Trie树和TCAM硬件相配合的路由查找算法 ,采用了自主设计的过滤算法对路由信息进行过滤 ,并应用 Zebra协议兼容 IPv4和 IPv6路由协议。模型可支持 2 .5 Gb/s接口的分组转发以及 2 0 0 0条 /s的路由更新速度。目前该模型已在国家“八六三”重大攻关项目——“核心路由器”中得到实现  相似文献   

18.
针对 W.Litwin提出的 Trie Hashing结构的路径长度分析问题,研究并揭示 了该结构所具有的某些新的性质;建立了必要的分析前提.从而给出了 Trie Hashing 结构平均路径长度的分析方法。所得估计式仅与外部结点数目有关,理论分析与模拟 实验的结果表明,对于 Trie Hashing 结构,文中的分析方法明显优于 Klein 和 wood的类似结果。  相似文献   

19.
针对传统聚类算法效率低、效果差和稳定性弱等弊端,提出一种新的云计算环境下关联性大数据实时流式可控聚类算法。介绍了关联性实时流式数据的定义和特点。通过粗聚类对实时抵达的数据元组进行相应的预处理,确定类簇的数量与中心点位置,形成通过存在差异的宏簇构成的集合,粗聚类采用的算法为Canopy算法。将粗聚类得到的宏簇传至K-means算法,给出了K-means算法的详细步骤,通过K-means算法完成细聚类,介绍了整个细聚类详细步骤。实验结果表明,所提算法具有效率高、质量好、稳定性强等优势,可有效实现云计算环境下关联性实时流式大数据聚类。  相似文献   

20.
本文把区域生长技术与FCM聚类方法结合起来,提出了一种快速FCM聚类分割算法.由于大大减少了参与聚类的样本数目,有效地提高了FCM聚类分割的速度.通过对遥感TM图像的分割实验,本算法比经典FCM聚类算法速度提高三倍以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号