首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 453 毫秒
1.
平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。  相似文献   

2.
聚类是数据挖掘中的关键问题,吸取了BIRCH算法中构造簇特征树来产生初始聚类中心的方法,提出了一种基于随机抽取的有限深度层次聚类算法(RSLDCH算法),采用随机抽取样本、限制特征树深度、构建叶子节点链表技术从而提高了算法的时间效率和聚类效果.实验表明,RSLDCH较BIRCH在运行速度和聚类效果上有一定的提高.  相似文献   

3.
一种基于最大最小距离和SSE的自适应聚类算法   总被引:1,自引:0,他引:1  
K均值聚类是一种常用的聚类算法,需要指定初始中心和簇数,但随意指定初始中心可能导致聚类陷入局部最优解,且实际应用中簇数未必是已知的。针对K均值聚类的不足,文中提出了一个自适应聚类算法,该算法基于数据实例之间的最大最小距离选取初始聚类中心,基于误差平方和(SSE)选择相对最稀疏的簇分裂,并根据SSE变化趋势停止簇分裂从而自动确定簇数。实验结果表明,该算法可以在不增加迭代次数的情况下得到更准确的聚类结果,验证了所提聚类算法是有效的。  相似文献   

4.
将神经网络引入到无线传感器网络中,提出了一种基于神经网络模型的分簇算法.为了建立合理有效的分簇结构,算法采用了一种基于三层神经网络模型的分簇式无线传感器网络体系结构,在进行分簇时根据相对信息熵来确定簇内的成员节点,保证了簇内节点的相关性较高.同时,还借鉴了神经系统的机制,根据节点间的相关性等参数让一部分节点处于抑制状态从而来均衡簇内的能耗.仿真实验结果表明,该算法能有效延长网络的寿命.  相似文献   

5.
为解决实时分析处理的海洋 Argo 浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题, 提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法 DBIRCH( Density-BasedBalanced Iterative Reducing and Clustering Using Hierarchies)。 该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制 CF(Clustering Feature)树生长的约束系数子空间阈值, 同时结合密度关联思想在不同邻域内多次建立 CF 树且合并, 最终以核心 CF 树子节点为聚类结果输出, 避免了 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖, 同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性, 提高了处理 Argo 剖面监测数据的时效性和算法的整体吞吐速度。 为测试算法的综合性能, 使用真实 Argo浮标剖面实时监测数据集, 并根据不同的参数对算法做出多组对比实验, 同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估, 从全局角度分析该算法在 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、 BIRCH 及 DBIRCH 3 种不同算法中综合聚类性能最优。 实验结果表明, 在3 种算法中,BIRCH 算法运算速度最快, 但准确率最低; DBSCAN 算法聚类性能高于 BIRCH 算法, 但运算速度最慢; 改进的DBIRCH 算法运算效率略低于 BIRCH 算法, 但聚类准确率最高。  相似文献   

6.
延长网络的生命周期是无线传感器网络研究中的重要问题,针对经典LEACH路由算法分簇机制中存在的不足,提出了一种改进LEACH算法.该算法分簇机制综合考虑了节点的状态以及分簇机制带来的开销,它通过计算每轮网络能量消耗速度来动态调整分簇的策略以减少了分簇机制产生的开销.改进协议将每轮分为簇的建立、簇问路由的形成、簇头簇内的...  相似文献   

7.
为解决聚类问题中簇的个数不易确定的难题,提出一种自动化的聚类方法.该方法针对不确定的簇个数,给出了一种新的粒子表示方法,并利用微粒群算法在完成一次聚类后,再利用kmeans算法重新分配数据对象并计算聚类中心.该方法利用结合凝聚度和分离度概念的轮廓系数来确定簇的个数,并用误差平方和来辅助验证.实验表明,该方法可以找到最佳的簇个数,并可以有效的对数据对象进行聚类.  相似文献   

8.
针对资源受限的纯相机无线多媒体传感器网络的能量消耗问题,改进了视觉相关性算法,并提出了一种新颖的基于视觉相关性的完全分布式节能策略.首先,根据视觉相关性系数算法计算相机的视觉相关性系数向量;其次,利用视觉相关性系数向量得到相机的竞争筹码并以此确定相机的角色;然后,运行两个并行且相互交互的操作:簇头相机根据簇头权重向量确定下一跳并完成路由建立;非簇头相机计算亲密度向量并且得到自己的簇ID.最后,实验结果表明本文提出的节能策略能有效地延长资源受限无线多媒体传感器网络的生命周期.  相似文献   

9.
两种综合赋权法在灌区评价中的应用研究   总被引:2,自引:0,他引:2  
阐述了基于离差平方和以及基于博弈论的综合集成赋权法的原理,并对这两种赋权法在灌区评价权重确定中的应用及其结果做了比较研究.分析结果表明,基于离差平方和以及基于博弈论的综合集成赋权法的指导思想虽然不同,但其原理都是科学合理的.在确定灌区评价权重时,若为了对各评价灌区对象充分拉开档次,可选用基于离差平方和的综合赋权法,当希望尽可能保留各主客观权重值的信息时,可选用基于博弈论的综合赋权法.  相似文献   

10.
随机选择初始聚类中心的k-means算法易使聚类陷入局部最优解、聚类结果不稳定且受孤立点影响大等问题.针对这些问题,提出了一种优化初始聚类中心的方法及孤立点排除法.该算法首先选择距离最远的两点加入初始化中心,再根据这两点将原始簇分成两个聚簇,在这两个簇中挑选方差较大的簇按照一定的规则进行分裂直至找到k个中心,初始中心的选择过程中用到孤立点排除法.在UCI数据集及人造含一定比例的噪音数据集下,通过实验比较了改进算法与其他算法的优劣.实验表明,改进后的算法不仅受孤立点的影响小、稳定性好而且准确度也高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号