首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为了提高银行客户分类的正确率,使银行的收益最大化,提出一种基于改进K均值聚类的银行客户分类算法.算法定义了类间最大相似度均值(AMS),并根据该定义确定最佳聚类数.当计算出的当下AMS值比前一次的AMS值小时,根据距离原则选择初始聚类中心;当计算出的当下AMS值比前一次的AMS值大时,把该最小AMS值相匹配的聚类中心看作初始聚类中心.利用最佳聚类数和初始聚类中心实现银行客户的细分.仿真结果表明,提出的算法能够跳出局部最优,并提高客户分类的正确率.  相似文献   

2.
为自动提取CT肺部肿瘤,辅助医生对患病部位进行诊断和治疗,利用K均值聚类算法自动提取肺部肿瘤和剩余肺部图像,并分别和影像医生手工分割的肺部肿瘤和剩余肺部图像作对比。结果表明,自动提取的肺部肿瘤图像与专业医学影像医生手工提取的肺部肿瘤图像在外形、灰度和方差方面非常接近,说明利用K均值聚类算法自动提取肺部肿瘤的方法是有效的、可行的。  相似文献   

3.
针对K-均值算法易受孤立点影响、对初始中心点选择敏感、易陷入局部最优的问题,对K-均值算法进行了改进,提出了一种自适应优化选择初始中心点的K-均值算法。实验结果表明,改进后的算法不仅较大程度上弥补了传统K-均值算法的不足,并且提高了聚类的稳定性和准确率。  相似文献   

4.
缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。  相似文献   

5.
针对K均值聚类算法存在的缺点,提出了一种基于自适应权重的粒子群优化(PSO)和K均值混合聚类算法.该算法在运行过程中通过引入非线性动态惯性权重系数,提高了混合聚类算法全局搜索能力和局部改良能力,并根据群体的适应度方差来确定K均值算法操作时机,增强算法局部搜索能力的同时缩短了收敛时间.将该算法与K均值聚类算法、基本PSO聚类算法和基于传统的粒子群K均值聚类算法进行比较,表明该算法不仅能有效地克服陷入局部最优,而且全局收敛能力和收敛速度都有所提高.  相似文献   

6.
列举了有关基于聚类融合的不平衡数据分类的办法,可以解决少数类的识别率很低,利用传统分类手段予以解决.利用此种方法能够发现,引入少数类边界区域与在多数类核心当中的样本聚类一致性系数,并且分别对欠抽样方法对少数类与多数类的训练集.  相似文献   

7.
在本文中主要介绍了图像分割的基本概念,应用C-均值聚类算法对Ki-67彩色图像进行分割,提取阳性细胞。  相似文献   

8.
图形聚类算法的代谢网络模块化分析   总被引:1,自引:0,他引:1  
代谢网络的研究是当今生物学研究中的新热点,使用图形聚类算法对代谢网络进行分析研究是一个有力的手段.文中提出了用图形聚类方法挖掘复杂代谢网络中蕴含的功能信息并进行模块相似性分析的方法,从系统生物学角度揭示光合作用的进化.介绍了马尔可夫聚类算法和模拟退火聚类算法两种图形聚类方法;给出了两种方法对叶绿体和蓝细菌的代谢网络进行聚类的结果;定义了模块相似度评价指标,挖掘叶绿体和蓝细菌间保守的功能模块,并对其网络结构进行了比较分析.  相似文献   

9.
基于分层聚类的k-means算法   总被引:8,自引:0,他引:8  
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。  相似文献   

10.
图书馆大规模日志数据的快速聚类   总被引:2,自引:0,他引:2  
给出了一种简单有效的算法,用于对图书馆大规模日志数据的快速聚类和借阅趋势分析。首先,根据读者基本的借阅规律,把日志数据聚成若干子类,然后,给出了对子类结果进行再次聚类的模糊算法。最后,为了预测读者的借阅趋势,对每一类进行了回归分析。该算法具有线性复杂度,对大规模数据集是可伸缩的,实验证明是可行的。  相似文献   

11.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

12.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果.  相似文献   

13.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

14.
李艳波 《河南科技》2013,(9):195+205
新媒体环境下政府部门要建立机制,加强管理引导,匡正驱邪,去伪存真,建立完善舆情监测、预警、引导机制,掌握网上话语权,客观研判舆情走势、评估舆情影响、引导舆情走向,促进和谐关系建设,积极维护社会稳定。  相似文献   

15.
一种改进的K means聚类彩色图像分割方法   总被引:1,自引:1,他引:0  
图像分割是从图像处理到图像分析的关键步骤.图像分割的目的是将图像分割为多个互不重叠且又各具特性的区域,主要应用于图像压缩、目标提取、模式识别等.以往的图像分割技术主要应用于灰度图像,随着计算机技术的进步,彩色图像分割逐渐受到关注.该文在前人对彩色图像分割问题的大量研究成果基础上,提出了一种将K-means聚类、蚁群算法以及分水岭算法相结合的分割方法.本方法有效的克服了聚类数目必须依据先验知识提前设定、最初的聚类中心是随机选取的、聚类的效果好坏依赖于距离判定公式的缺陷.  相似文献   

16.
为了找出与肝癌发生发展有关的基因,利用随机矩阵理论及层次聚类法分析肝癌基因网络,构建了肝癌基因层次树图,分析得到5个具有不同功能的基因团簇,并预测WNT4、SLU7基因与B淋巴细胞免疫过程有关,LMNB2、CDC7L1、H2AFX基因能促进肝癌细胞的增殖.  相似文献   

17.
提出了一种基于k均值聚类的混合异构图像隐写分析算法. 在训练阶段,根据图像纹理复杂度对图像库
进行聚类,并针对每一类图像训练相应的分类器. 在测试阶段,根据测试图像的纹理复杂度对其进行类别判断,然
后送至相应类别的分类器中进行隐写检测,从而减弱了失配状态对现有隐写分析算法造成的影响. 实验结果表明,
该算法较好地提高了现有隐写分析算法的检测精度.  相似文献   

18.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

19.
针对车险续保概率,运用K-means聚类算法,混合因素分析法建立了客户分群模型,广义线性混合模型,使用MATLAB,SPSS,Excel等软件进行处理分析.研究得出车险客户的精准画像并给出了客户分析报告和相应的续保概率.总结出了一套车险费率算法,为不同类型的客户量身定制了车险方案,以提高车险客户的续保概率.  相似文献   

20.
针对传统网络负载异常监测方法中精准度较差、有效性较低等问题,本文提出一种基于爬虫大数据的网络负载异常监测方法。为了验证该方法的有效性,将其与传统监测方法进行对比实验。实验结果表明,该方法实用性和精准度更高,更适用于对网络负载异常的监测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号