首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
以安徽城市管理职业学院的网络用户为例,通过校园网管理平台获取的大量网络用户行为数据,采用K-means算法建立用户行为数据挖掘模型,挖掘得出聚类结果,然后基于分析结果,对校园网的管理平台进行新的配置,使校园网运行更加合理,从而提供更加快捷平衡的网络服务。  相似文献   

2.
K-means算法需要人工设定聚类个数且易受孤立点影响,根据这个缺陷提出了一种新的改进算法。改进算法通过设定初始值及初始值的最大值,在聚类过程中自动获取聚类数k。实验结果表明,该算法在一定程度上缓解了K-means算法对初始值敏感及受孤立点影响的问题,能产生高质量的聚类结果。  相似文献   

3.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

4.
一种改进的基于密度和样本数量的K-means算法   总被引:1,自引:0,他引:1  
对原始K-means算法进行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点。首先,寻找样本容量的最大可能初始聚类数n。然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类。最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并。为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验,验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法。  相似文献   

5.
【目的】研究评价问题中评价对象因个体差异性的聚类问题。【方法】首先引入夹角余弦刻画评价对象个体间倾向性上的差异大小,其次利用余弦相似度与欧式距离刻画评价对象的总体相似度,对Tzortzis和Likas提出的min-max K-means聚类算法进行改进。【结果】利用某高校参与评价教师的指标数据集进行初步的数值实验,证明了改进K-means算法的有效性。【结论】余弦相似度刻画考核对象的偏向性差异,很好的克服了欧式距离只考虑数值绝对值上的差异,具有重要的现实意义。  相似文献   

6.
面对日益激烈的竞争环境,不管是金融行业,还是电信行业,企业运营营销方式从大众化营销转为根据不同的用户群体需求提供的差异化营销,而差异化营销的关键因素就是用户有效细分。本文根据通信用户通话数据作为分析对象,通过采集相关特点人群呼入呼出次数、通话持续时长等数据比较筛选后得到相关特征,对用户通话数据进行聚类,以此获取具有良好电信特征的群体。然后在以上筛选基础上,结合用户数据,采用K-means算法挖掘出用户数据与相关工作业务之间存在的相关关联性结果。企业可以此类用户细分为指导,为用户提供更好的优质服务。  相似文献   

7.
针对K-means聚类算法对初始聚类中心敏感问题,提出1种结合方差与误差平方和的优化算法.首先,该算法基于方差和距离选取k个位于不同区域且样本点相对集中的集合.然后,分别选取使这k个样本集合误差平方和最小的数据作为k个初始聚类中心.利用改进算法与其他算法将UCI数据库中所选取的数据集进行聚类划分,对比不同算法下的聚类结...  相似文献   

8.
K-means算法是聚类方法中常用的一种划分方法.基于扩展划分的思想,提出了一种基于扩展的K-means聚类算法(EK-means),在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K-means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况.该算法使用了基于距离的技术来处理孤立点,引进了一种基于扩展的方法进行聚类.实验表明该算法可扩展性好,能够很好的识别出孤立点或噪声,并且有很好的精度.  相似文献   

9.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

10.
作为一种常用的在线文档聚类算法,STC算法聚类结果在用户个性化方面存在不足。改进后的算法结合用户兴趣模型,通过增加基类选择因子和改善基类合并规则来进行改进,实现基于用户兴趣特征的个性聚类效果。实验表明,改进后的算法具有较好的准确性和效率。  相似文献   

11.
基于改进GA的K-均值聚类算法   总被引:3,自引:0,他引:3  
利用遗传算法或免疫规划算法解决初始聚类中心是较好的方法,但容易出现局部早熟现象.为了克服以上缺点,借助免疫机制的优点,将免疫原理的选择操作机制引入遗传算法中,提出基于改进遗传的K-均值聚类算法,该方法结合K-均值算法的高效性和改进遗传算法的全局优化能力,较好地解决了聚类中心优化问题.试验结果表明,本算法能够有效改善聚类质量.  相似文献   

12.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

13.
针对海量新闻的个性化推荐算法进行研究,提出一种改进的推基于K-means聚类的协同过滤用户推荐算法.该算法首先随机初始化了K个质心,按照重新定义过的新的用户相似度公式将用户进行K-means聚类,并选取相似度最大的作为当前用户所属类别;然后再重新定义了质心并进行迭代聚类;最后在每一个用户类里应用基于用户的协同过滤推荐算法,并给用户合理的个性化推荐.仿真实验测试表明,新算法能够提高推荐的准确率,并且有效提高了扩展性.  相似文献   

14.
基于聚类实现客户行为分析   总被引:12,自引:4,他引:8  
在介绍客户行为分析一般过程的基础上,提出了一种实现客户行为分析的聚类算法.该算法通过构造模糊相异矩阵,将高维、海量的客户消费模式映射到二维平面,进一步利用遗传算法(GA)进行优化,快速而灵活地实现客户行为的聚类分析,发现大客户.  相似文献   

15.
一种改进的全局K-均值聚类算法   总被引:3,自引:0,他引:3  
将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远的样本为下一个簇的最佳初始中心,得到一种改进的全局K-均值聚类算法.改进后的算法不仅可以避免将噪音点作为下一个簇的最佳初始中心点,而且在不影响聚类效果的基础上缩短了聚类时间.通过UCI机器学习数据库数据以及随机生成的人工模拟数据实验测试,证明改进的全局K-均值聚类算法与全局K-均值聚类算法及快速全局K-均值聚类算法相比在聚类时间上更优越.  相似文献   

16.
针对传统K-means算法在初始质心选取的敏感性以及迭代计算的冗余性这两方面的缺陷,提出一种高效的聚类算法(ECA).根据数据对象的空间分布情况,首先采用空间划分预聚类算法(SDPCA)对数据集实现预聚类划分,然后采用基于邻近簇调整的优化聚类算法(OCANC)对预聚类成果进行优化处理,最终获取聚类成果.实验证明,该改进算法能消除对初始输入的敏感性,以更高的运行效率获取较高质量的聚类结果.  相似文献   

17.
基于改进k-均值聚类的纸币冠字号图像分割算法   总被引:1,自引:0,他引:1  
针对传统彩色图像分割方法的局限性,提出了基于HSI色彩空间和改进K-均值聚类的图像分割方法,通过将彩色图像分解成三个相互独立的H、S、I分量,利用各个分量特点及其直方图确定聚类类别和初始聚类中心,在高饱和度区和低饱和度区分别聚类,并将聚类结果合并取交集,从而分割出目标区域.将该方法用于纸币冠字号码图像分割,经仿真验证,结果不受噪声和局部边缘变化的影响,分割效果得到明显提升,为后续冠字号准确识别提供了良好的基础.  相似文献   

18.
针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法.算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值.实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44%,可为相关应用提供更精确的定位服务.  相似文献   

19.
提出的基于距离浓度的K-均值聚类算法把聚类的数据对象视为抗原,聚类中心看作是免疫系统中的抗体,聚类过程表示为免疫系统不断产生抗体,识别抗原,最后产生出可以捕获抗原的最佳抗体过程.定义了抗体浓度和亲和度,使得抗体之间的距离越大,其距离浓度越小,反之则浓度越大,从而提高了算法的搜索效率.设计了抗体的期望繁殖率计算方法和克隆变异方法.仿真结果表明:该算法不仅克服了传统的K-均值聚类算法易陷入局部极小值的缺点,而且避免了对初始化选值敏感性的问题,同时也有较快的收敛速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号