首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
图像聚类是当前的研究热点,非负矩阵分解(non-negative matrix factorization, NMF)算法在图像聚类领域得到了广泛应用。但是单一的NMF算法无法应用于所有数据集,并且NMF算法直接在数据的原始空间进行处理,抗噪能力较差。集成聚类可以解决上述问题,集成聚类将若干个基础聚类结果合成一个一致性结果,不仅可以提高聚类的求解质量,还可以增强算法的鲁棒性。因此本文提出一种层次预处理的NMF加权集成聚类算法。该算法将层次划分、集成聚类和二部图的思想引入到NMF算法中。在预处理阶段,利用层次划分得到聚类数目。之后采用局部加权的方法得到协关联矩阵。最后利用基于二部图的一致性函数进行划分得到最终的聚类结果。在5个数据集上进行实验,验证了本文算法相对于传统算法和其他集成算法的有效性。  相似文献   

2.
模糊C均值聚类算法(FCM)是一种比较有代表性的模糊聚类算法,主要是通过迭代更新聚类中心和隶属度矩阵,使目标函数值达到最小.FCM算法还有很多缺陷和不足,其中最主要的就是选取不同的初始中心,会得到不同的聚类结果,影响到聚类的稳定性和准确率.本文对要聚类的数据集采用数据分区技术进行预处理,根据物质质心的定义及质心运动原理...  相似文献   

3.
为降低供水管网漏损,实现供水管网快速准确分区,提出一种耦合模块度优化与谱聚类的供水管网分区算法。该算法采用快速模块度优化算法对供水管网进行社区划分,以每个社区为节点、社区间连接关系为边,结合各社区内的水力特征和空间区位特征计算差异性作为边权重,构建对偶图。利用谱聚类算法完成供水管网分区。结果表明,该算法求解的管网分区结果相比快速模块度优化和谱聚类算法,将空间上更邻近的管段划分在同一分区,不会产生狭长型无效分区,且在模块度及边界管道数量上表现较为均衡,管网分区方案不仅模块度高,而且边界管道数量少。  相似文献   

4.
针对传统K-eans 算法因初始聚类中心的随机性而导致聚类结果产生很大的波动性问题, 提出一种基于最小距离乘积聚类算法CAMDP(Clustering Algorithm based on Min-Distance Product), 利用数次抽样技术, 在得到的聚类中心集合上继续使用最小乘积法寻找最佳的初始聚类中心, 较大程度减少了K-eans聚类算法对初值选取的随机性。实验结果表明: 改进后的K-eans算法既考虑了网络结构的拓扑信息, 又考虑了节点的属性特征, 为社区划分提供了有力的决策支持。  相似文献   

5.
针对传统聚类算法存在挖掘效率慢、 准确率低等问题, 提出一种基于最小生成树的多层次k-means聚类算法, 并应用于数据挖掘中. 先分析聚类样本的数据类型, 根据分析结果设计聚类准则函数; 再通过最小生成树对样本数据进行划分, 并选取初始聚类中心, 将样本的数据空间划分为矩形单元, 在矩形单元中对样本对象数据进行计算、 降序和选取, 得到有效的初始聚类中心, 减少数据挖掘时间. 实验结果表明, 与传统算法相比, 该算法可快速、 准确地挖掘数据, 且挖掘效率提升约50%.  相似文献   

6.
传统的k-means聚类算法对初始聚类中心非常敏感,聚类的结果也常常随着初始聚类中心而波动。为了降低聚类算法的这种敏感性,本文提出了一种自适应的聚类算法(SA—K—means),该方法通过计算数据对象区域的密度,选择相互距离最远的高密度区域的中心作为初始聚类中心。实验表明SA—K—means聚类算法能有效地消除聚类算法对初始聚类中心的敏感性,得到满意的聚类结果。  相似文献   

7.
针对宏观路网区域交通状态预报需要首先产生路网区域的需求,提出了一种新的基于交通指数聚类的路网区域动态划分方法。首先对整个城市路网进行网格化划分,将路段划分为从属于某个网格的子路段;然后,计算每个网格的交通指数,提取网格特征,从而得到样本特征矩阵;接着,利用k-means~(++)聚类算法对样本特征矩阵进行聚类,得到初始聚类标签,并对其中奇异网格的聚类标签加以修正;最后,得到划分后的路网区域。为了验证该方法的性能,利用上海市的GPS数据对上海市进行了路网区域的划分,并与不同聚类方法的结果进行了对比。结果表明,新方法对路网区域划分的精度及稳定性均有所提高。  相似文献   

8.
为降低杂波对量测集划分的影响,提出了一种基于快速密度峰值聚类的多扩展目标跟踪算法.首先分析不同分区对跟踪结果的影响,得到最"信息"分区的形式,然后利用快速密度峰值聚类(FDPC)算法对量测集进行划分,减少杂波对量测集划分的影响.实验结果表明,所提算法能够有效抑制杂波的影响,在保证跟踪性能损失不大的情况下大大提高了算法的计算效率,具有较好的应用价值.  相似文献   

9.
【目的】将人工智能领域的技术应用于网贷平台风险识别,提出了一种用于P2P网贷平台的风险评估模型,为网贷平台的风险划分提供决策支持。【方法】通过因子分析提取因子指标,进而利用K-means聚类算法对基于因子指标变化后的网贷平台运营数据进行聚类簇的划分,最终通过聚类结果对P2P网贷平台的风险进行划分。【结果】在获取真实网贷数据之后,采用皮尔森相关系数对平台指标进行影响指标的划分,随后使用因子分析将影响指标转化为因子指标,并在因子指标的基础上采用K-means算法对数据进行聚类分析。【结论】实验结果表明,因子分析聚类方法所得到的分析结果更为符合网贷数据所对应公司产品的实际情况,所得结论符合金融领域的实际情况,其聚类结果对网贷平台的风险评估和风险预测具有指导性的意义。  相似文献   

10.
针对电信客户"亲友通话圈"定价决策的需要,提出一种基于有向图的蚁群聚类算法对电信客户进行聚类.该算法在构造客户通话有向图的基础上,利用蚂蚁在搜索过程中不断积累信息素,更新有向图,并通过划分强连通分量得到亲友通话圈.通过对真实数据集的测试,算法可以有效、快速地形成聚类,合理地划分亲友通话圈.算法可以针对若干不同的阈值产生不同的聚类结果,选取其中成本最小者,从而获得最大利润,有效解决了通话圈定价的问题.  相似文献   

11.
本文针对学生商业实践课程实训需求,提出了基于WEFCMO算法的引导型商品营销实训辅助策略。通过建立商品关联数据网络,获取各商品节点关系的集合,再依据新旧属性及类别属性对商品进行档次划分,运用零售商品数据的快速聚类(WEFCMO)算法进行聚类,最终得到聚类结果,为学生实训提供引导式商品营销信息支撑。  相似文献   

12.
模糊C-均值聚类算法(F(M)是很早的目标函数聚类算法,也是目标函数聚类算法中研究的比较充分的算法之一,FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。此算法的缺点是当数据量非常庞大时,算法的运算过程就会非常耗时,甚至是无法完成运算。  相似文献   

13.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

14.
梁卓灵  元昌安  覃晓 《广西科学》2020,27(6):616-621
为改善交通拥堵的情况,本文利用聚类分析方法对移动轨迹数据进行挖掘,识别居民出行的热点区域。传统的Ng-Jordan-Weiss (NJW)谱聚类算法常使用K-means聚类算法来实现最后的聚类操作,然而K-means聚类算法存在对初始值敏感、容易陷入局部最优的缺陷,影响对热点区域的挖掘结果。因此,本研究将方差优化初始中心的K-medoids聚类算法运用到谱聚类算法最后聚类阶段,提出基于方差优化谱聚类的热点区域挖掘算法(Hot Region Mining algorithm based on improved K-medoids Spectral Clustering,HRM-KSC),然后在真实的轨迹数据集上进行试验。试验结果发现,HRM-KSC算法聚类结果的轮廓系数更高,表明HRM-KSC算法改善了NJW谱聚类算法,提高了聚类质量。  相似文献   

15.
乳腺核磁共振影像( MR)的有效分割一直是医学影像分析领域的研究热点。针对目前人工解读图像信息的不足,提出一种自动化分割乳腺MR图像的方法,该方法结合传统FCM算法和最小距离分类器实现了感兴趣区域中不同位置、灰度值相似的样本点按距离分类。算法首先根据图像的灰度信息利用FCM算法实现聚类,其次自动提取感兴趣区域的聚类信息,并利用最小距离分类器对其按距离分类。实验结果表明,该算法对乳腺核磁共振影像的分割具有较高的准确性,提高了其组织划分的精度,且自动化程度比较高,为后续进行肿瘤区域的自动提取与识别奠定基础。  相似文献   

16.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行.  相似文献   

17.
提出一种新的基于分区管理节点的路由算法——基于节点地理位置的路由算法(I-ERIDSR).新算法在节点部署后,定义网络分区半径的计算方法,按照分区半径对监测区域进行划分,并布置管理节点,根据节点间距离和节点能量计算节点的通信代价,完成路由节点的选择.  相似文献   

18.
移动无线传感器网络中,节点的移动性影响着层次化聚类之后的网络结构,从而影响聚类内部节点间通信时的数据送达率与能耗.为了降低节点移动性的影响,本文提出了一种分布式重聚类算法.该算法基于已聚类网络,利用粒子滤波算法对节点当前位置进行估计,并结合移动模型预测下一时刻位置;处于聚类边界的非簇头节点周期性地评估自身是否需要重聚类,并在需要时通过与所属聚类及目标聚类的簇头节点通信,将自身重聚类到目标聚类中.仿真结果表明,在重聚类周期较小时,该算法能够使节点在移动过程中保持合理的通信距离,并在数据送达率与能耗方面优于现有的算法.  相似文献   

19.
子空间聚类能有效的发现各簇与所属于的子空间的联系,同时减少高维数据中因为数据冗余和不相关属性对聚类过程产生的干扰.已有的子空间聚类方法强调各子空间中簇的发现,往往忽略子空间的划分.提出了基于属性最大间隔的子空间聚类,该方法主要思想是对子空间的划分时信息的丢失达到最小,从而子空间聚类的结果的效果比较好.主要工作包括:第一,建立了子空间划分的目标函数,也就是使各划分的子空间相互依赖达到最小,第二,设计了基于属性最大间隔的子空间聚类算法Maximum Margin Subspace Clustering(MMSC)进行子空间聚类集成.最后,采用UCI和NIPS2013比赛等数据来做实验,结果表明,在大多数数据上MMSC算法比其他子空间算法能得到更好的聚类结果.  相似文献   

20.
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法。该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的 K-means 聚类算法将数据集划分成微聚类,并检测微聚类的离群点。通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号