首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 890 毫秒
1.
基于混合聚类算法的动态R-树   总被引:1,自引:0,他引:1  
针对动态R-树是通过动态插入算法建立起来的, 其节点分裂算法的性能直接影响到R-树的性能和查询效率的问题, 为了使动态R-树适应多维复杂空间数据的要求, 提出一种用于实现R-树节点分裂的混合聚类算法(HCR), 它建立在普通聚类算法的基础上, 并进行了一系列扩充. 针对空间对象的均匀分布与不均匀分布, HCR算法在实现R-树节点分裂时分别采用不同的聚类准则以提高其聚类效果和查询效率. 此外, 还将HCR算法与其他算法进行对比实验, 结果表明该算法具有较高的查询效率.  相似文献   

2.
信息传递是网络具有的基本特征,基于此提出了一种基于信息传递和峰值聚类的自适应社区发现算法。首先,定义了节点与邻居之间的信任度函数,每个节点基于信任度独立的向网络中扩散信息量。扩散结束后,节点总信息量即为峰值聚类中的密度;网络中节点之间的距离通过所含节点信息量的倒数替代。然后,提出一种自动选取核心节点方法并为核心节点分配不同社区,把剩余节点分配到与它距离最短的核心节点所在社区,完成社区划分。本算法的优点在于无需额外参数并且能够发现社区内部结构。实验结果表明本算法发现的社区结构更加接近网络真实社区结构。  相似文献   

3.
移动无线传感器网络中,节点的移动性影响着层次化聚类之后的网络结构,从而影响聚类内部节点间通信时的数据送达率与能耗.为了降低节点移动性的影响,本文提出了一种分布式重聚类算法.该算法基于已聚类网络,利用粒子滤波算法对节点当前位置进行估计,并结合移动模型预测下一时刻位置;处于聚类边界的非簇头节点周期性地评估自身是否需要重聚类,并在需要时通过与所属聚类及目标聚类的簇头节点通信,将自身重聚类到目标聚类中.仿真结果表明,在重聚类周期较小时,该算法能够使节点在移动过程中保持合理的通信距离,并在数据送达率与能耗方面优于现有的算法.  相似文献   

4.
为了从人工神经网络中抽取规则,提出一种新的规则抽取算法。网络被训练并剪枝后,将隐节点的激活值离散化,对输入到隐节点的权重进行聚类,聚类过程中可根据隐节点的激活值动态调整权值聚类数目,进而高效准确地抽取规则。实验结果表明,该算法可明显降低规则抽取的时间复杂度,减少生成规则的数量。  相似文献   

5.
基于经典流聚类框架CluStream和密度聚类算法DBSCAN,提出了一种分布式实时数据流密度聚类算法DBS-Stream,并在Storm流式处理平台上设计了算法实现方案.该算法局部节点使用CluStream的两段式经典框架,在线微聚类中利用DBSCAN代替K-means初始化数据,在中心节点再使用DBSCAN算法进行全局聚类.该算法可解决任意型聚类问题,并可使局部节点快速更新数据.将DBS-Stream算法与CluStream算法进行比较,实验结果表明,本研究算法在聚类质量和通信代价方面均优于CluStream.  相似文献   

6.
为了解决集中式聚类算法不能处理海量大数据的问题,提出基于Fisher判别确定置信半径的分布式聚类算法.应用网络上各个节点的计算、存储能力,以及网络的带宽,将聚类所需的时间复杂度和空间复杂度平摊到各个节点.通过应用Fisher线性判别找到节点在同一子类数据上的稠密和稀疏分布,从而快速确定聚类的置信半径并指导下一步的聚类过程,使得保持聚类精度的同时能提高分布式聚类的速度.对算法进行了数值模拟,并使用真实数据完成了试验.结果表明,所提出算法相比DFEKM聚类算法,能根据数据分布的不同在聚类结果和聚类速度上达到很好的平衡,这表明该算法具有更好的健壮性.  相似文献   

7.
针对现有大数据空间查询处理方法存在执行时间长和查询结果不够准确的问题,提出一种基于动态分布式聚类算法的大数据查询处理方法,该方法分为数据预处理、数据聚类和查询处理3个部分.首先将输入数据划分为多个子集,以RRD格式存储在一组机器节点中;其次采用划分和层次混合动态聚类算法,在Apache Spark平台上对数据进行分布式...  相似文献   

8.
通过分析无线Mesh网络节点空间属性,提出了一种改进的k-medoids网络节点聚类算法.该算法基于聚类思想,将无线Mesh网络中的网关部署问题转化为空间节点数据聚类问题.构建了网络拓扑图的邻接矩阵,并利用邻接矩阵选择具有最多一跳连接节点数的对象作为初始簇中心.然后以网络跳数代替传统聚类算法中的距离参数,将最小化跳数之和作为优化目标,通过迭代方法获得稳定的聚类和分组结果.实验结果表明,离散的网络节点在空间上具有聚类特性,利用该方法可以获得更小的平均跳数和最大跳数,因此可以较好地实现网络节点分组和网关发现.  相似文献   

9.
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。  相似文献   

10.
针对无线传感器网络中存在的节点能量受限、网络循环利用周期短、吞吐量少等问题,提出了基于分簇的动态路由协议KACO。算法初始阶段采用改进的K-means聚类和蚁群聚类算法获得网络分簇;综合考虑节点的能量效率、当前节点与基站的距离、节点与簇内其他节点间的距离3个方面的因素选择簇头节点。在数据传输阶段,根据节点间的距离动态调整传输路径,有效地减少了节点在数据传输时的能量消耗。实验结果表明,与其他基于分簇的网络节能方法相比较,该方法取得了较好的性能。  相似文献   

11.
针对传统模糊聚类算法需提前设置参数和初始聚类中心, 导致聚类结果不稳定的问题, 提出一种基于权重差异度的动态模糊聚类算法. 首先引入样本特征权重向量和样本间差异度的概念, 对数据集分布情况进行描述, 并采用新的评价指标获取候选聚类中心; 然后根据最小差异度准则, 对剩余样本点进行分类; 最后结合Davies-Bouldin指数(DBI)评价准则对候选聚类中心做进一步筛选与合并. 实验结果表明, 该算法在不同测试数据集上的性能明显优于传统聚类算法, 具有更高的自适应性和稳定性.  相似文献   

12.
设计一种基于AP聚类算法和SVM分类器相融合的新的混合分类器, 使用AP聚类算法优化数据集, 得到了高质量、 小样本的SVM分类器训练集. 实验结果表明: 与传统的SVM分类器相比, 混合分类器具有更高的分类精度; 在心脏病预测上, 该分类器的效果较好.  相似文献   

13.
改进模糊聚类算法及其在入侵检测中的应用   总被引:1,自引:0,他引:1  
针对将数据集隶属度概率和为1的条件用于模糊性事件时,影响聚类的正确率的情况,在不确定理论的基础上,研究了数据隶属度问题,提出一种新的基于隶属关系不确定的可能性改进模糊聚类算法.该算法在迭代过程中将聚类的可能隶属度与不确定性隶属度引入到目标函数中,使得样本中的元素不局限于仅属于一个聚类,与现有的聚类算法相比具有更好的聚类结果.通过在KDDCUP99数据集上实验,验证了该算法在入侵检测中的检测率为95.8%, 分别高于K-均值算法的检测率(60.4%)和FCM算法的检测率(64.6%).  相似文献   

14.
一种基于局部信息的聚类密度度量   总被引:1,自引:0,他引:1  
为有效处理密度不均匀聚类问题,以数据集蕴涵的局部信息为出发点,提出一种数据点密度度量———松散度,用以揭示数据点与其相邻数据点的相对紧密程度及类属关系,从而解决密度不均匀聚类问题.依据松散度的性质实现了一种基于松散度的聚类方法,以验证松散度度量的有效性.实验结果表明,使用松散度来度量数据点的聚类密度信息可以有效处理密度不均匀聚类问题.  相似文献   

15.
为了解决传统算法检测准确性低,复杂性高不适于电力大数据异常值检测的问题,通过密度峰值聚类算法研究了电力大数据异常值检测问题。分析了密度峰值聚类算法的聚类过程。按照聚类中心选择原则,通过相邻距离和密度的归一化乘积对聚类点的差异度进行衡量,按照差异度的统计特性与改变趋势选择最大的一组点当成聚类中心。按照z空间填充曲线与高维数据点z携带位置信息特性提出基于z的分布式密度峰值聚类算法,降低异常检测复杂性,以达到电力大数据异常值检测要求。采用优化后的密度峰值聚类算法对电力大数据异常值进行检测,在局部密度超过阈值,同时距离超过阈值的情况下,认为相应电力数据点为异常值。将基于距离的检测算法和基于密度的检测算法作为对比进行测试,结果表明:所提算法得到的异常电力数据点,和实际情况相符,和其他两种算法相比没有出现错检测和漏检测的情况。可见所提算法适于电力大数据异常值检测,且检测结果准确性高。  相似文献   

16.
移动自组织网中一种平均节点度分簇算法   总被引:1,自引:0,他引:1  
针对移动ad hoc网络现有分簇算法容易造成通信瓶颈的现象,在最高节点度分簇算法的基础上提出了基于平均节点度的分簇方法,通过选举具有合适节点度大小的节点作为簇头来平衡网络负载,应用Glomosim做的仿真结果显示该算法能较好维持网络的稳定性.  相似文献   

17.
针对移动adhoc网络现有分簇算法容易造成通信瓶颈的现象,在最高节点度分簇算法的基础上提出了基于平均节点度的分簇方法,通过选举具有合适节点度大小的节点作为簇头来平衡网络负载,应用Glomosim做的仿真结果显示该算法能较好维持网络的稳定性。  相似文献   

18.
In the K-means clustering algorithm, each data point is uniquely placed into one category. The clustering quality is heavily dependent on the initial cluster centroid. Different initializations can yield varied results; local adjustment cannot save the clustering result from poor local optima. If there is an anomaly in a cluster, it will seriously affect the cluster mean value. The K-means clustering algorithm is only suitable for clusters with convex shapes. We therefore propose a novel clustering algorithm CARDBK—"centroid all rank distance(CARD)" which means that all centroids are sorted by distance value from one point and "BK" are the initials of "batch K-means"—in which one point not only modifies a cluster centroid nearest to this point but also modifies multiple clusters centroids adjacent to this point, and the degree of influence of a point on a cluster centroid depends on the distance value between this point and the other nearer cluster centroids. Experimental results showed that our CARDBK algorithm outperformed other algorithms when tested on a number of different data sets based on the following performance indexes: entropy, purity, F1 value, Rand index and normalized mutual information(NMI). Our algorithm manifested to be more stable, linearly scalable and faster.  相似文献   

19.
为解决当前网络舆情大数据收敛算法普遍存在的收敛困难及热点聚类生成速度较低等难题,提出了一种基于聚合度热点适应机制的网络舆情大数据收敛算法。首先,通过增量用户节点与存量热点之间的信息交互关系,设计了一种基于聚合度初始化机制的数据收敛方案,采用匹配机制逐个对存量热点与增量用户节点间差异度及聚合度进行比对,能够将增量用户节点纳入性能最佳的存量热点所形成的种子聚类,提高聚类形成速度。随后,针对热点数量处于密集状态等极端情况,特别是用户特征匹配过程中难以实现快速匹配等不足,设计迭代方式,以逐步消除种子聚类差异度,提升大数据匹配性能,改善用户节点与热点之间信息交互质量。仿真实验表明:与当前常用的时间片累积挖掘收敛方案(Convergence Scheme for Time Slice Cumulative Mining,TSCM算法)及热点度显影收敛方案(Convergence Scheme of Hotspot Degree Development,HDD算法)相比,本文算法具有更高的收敛速度和聚类形成质量。  相似文献   

20.
二型模糊神经网络结合了二型模糊系统描述实际情况不确定性和神经网络的学习能力,在非线性系统的辨识中得到了广泛应用。二型模糊神经网络参数学习使用最多的是反向传播算法算法,该算法原理简单,易于实现。但是该算法对初值敏感,不合适的初始会导致算法收敛于非最优解或者发散。针对反向传播算法的这一缺点,提出了一种基于模糊C均值聚类的区间二型模糊神经网络辨识算法。该算法选择高斯型隶属度函数,将模糊C均值算法得到的聚类中心初始化高斯函数的中心,而高斯函数的宽度利用模糊C均值聚类算法的隶属度和中心求取。通过2个非线性系统的辨识效果表明,提出的辨识算法具有较高的辨识精度,收敛速度较快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号