首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为合理确定批量定制服装的版型数量,运用K-means算法,以4个测量项目(身高、胸围、腰围、领围)为分类变量对347名男性进行聚类分析.分别以国标和非国标号型对初始聚心选择和聚类数的确定进行探讨,并以Calinski-Harabasz(CH)指标、变异系数和相对偏差比较了国标和非国标号型的聚类效果.研究结果表明,运用最大最小距离法确定初始聚心的非国标号型分类结果与国标GB/T 1335.1—2008分类结果对比,在相同CH值时,服装版型数由26减少到18,身高、胸围、领围和腰围相对偏差超过3%的比例分别从5.48%,39.48%,7.49%,60.52%降低到0.58%,8.07%,3.17%,12.97%.测量项目波动性从大到小依次为腰围、领围、胸围和身高.  相似文献   

2.
以国家号型标准及企业设定规格的规律确定理论人体尺寸及分配方案.通过号型归档计算用料成本、裁剪时间等多种指标,得出各企业合理的号型规格数,作为各企业制定号型规格的参考。  相似文献   

3.
以黑龙江省中部地区2004年的气温和降水观测数据为实例,对数据挖掘中气象数据的概化问题进行研究.调查分析了概化方法和数据特征,确定采用模糊C均值聚类算法.重点研究了算法中最佳聚类数的确定,选取多种广泛认可的指标,对聚类结果进行有效性对比分析,采用综合最优的聚类数为最佳聚类数.研究发现这种方法聚类结果合理且具有较强的可拓展性.  相似文献   

4.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

5.
基于模糊迭代聚类的水资源分区研究   总被引:3,自引:1,他引:3  
给出一种模糊聚类循环迭代模型以及确定最佳聚类数的方法,采用交叉循环迭代的方法确定聚类中心,通过判断聚类准则函数获得最佳聚类数。最后将模糊聚类循环迭代模型应用到对我国 29 个省、市、自治区的水资源分区的研究中,将水资源按照 4 个指标分为 5 个类别,结果表明,模糊循环迭代聚类模型得出的分区结果比较合理。  相似文献   

6.
针对GB/T1335.1-1997男装号型标准中,体型分类指标单一,体型分类不够细致的现状,利用三维人体扫描技术采集了成年男性长度、围度、宽度、厚度等方面的人体数据,采用主成分分析从中提取了不同体型聚类指标,进行了相应的体型聚类分析.所得结果表明,应用主成分分析法进行成年男性体型聚类可改进当前国标体型分类指标单一的不足,达到细化体型分类的目的,完全符合大规模量身定制时代对体型分类的要求.  相似文献   

7.
一种基于最大最小距离和SSE的自适应聚类算法   总被引:1,自引:0,他引:1  
K均值聚类是一种常用的聚类算法,需要指定初始中心和簇数,但随意指定初始中心可能导致聚类陷入局部最优解,且实际应用中簇数未必是已知的。针对K均值聚类的不足,文中提出了一个自适应聚类算法,该算法基于数据实例之间的最大最小距离选取初始聚类中心,基于误差平方和(SSE)选择相对最稀疏的簇分裂,并根据SSE变化趋势停止簇分裂从而自动确定簇数。实验结果表明,该算法可以在不增加迭代次数的情况下得到更准确的聚类结果,验证了所提聚类算法是有效的。  相似文献   

8.
针对传统K-means算法随机选择初始聚类中心容易造成聚类结果不稳定且准确率低等问题,基于拟蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一种新的初始聚类中心确定方法;该算法利用QMC序列分布的超均匀性特点,对整个样本空间中的样本分布进行采样估计;基于k近邻距离(k-distance)对QMC序列点进行加权的K-means聚类,得到初始聚类中心。该算法的计算复杂度为O(max(d、n)logn),其中d、n分别表示样本数据的维数和数量;在人工数据和实际数据集上的仿真实验表明,该算法能选择更优的初始聚类中心,有效降低K-means算法的迭代次数,提高聚类的准确性、鲁棒性和收敛速度。  相似文献   

9.
针对聚类算法在入侵检测应用中存在的参数预设、聚类有效性评价、未知攻击类型检测等问题,提出了一种基于密度和最优聚类数的改进算法,根据样本的分布情况启发式地确定初始聚类中心,从样本的几何结构角度提出一种新的内部评价指标,给出了最优聚类数确定方法,在此基础上,设计了一个增量式的入侵检测模型,实现了聚类中心和聚类数目的动态调整.实验结果表明,与K-means及其他两种改进聚类算法相比,新算法收敛速度更快、聚类准确率更高,能够对未知网络行为进行有效聚类,具有较好的入侵检测效果.  相似文献   

10.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

11.
传统的k-means算法聚类由于k值的给定有一定的主观性,从而造成聚类精度的下降.为更好地利用k-means均值进行聚类,这里进行了两个方面的优化处理,分别是优化k值和改进初始聚类中心.本文以2016年我国31个省市自治区的CPI价格指数为研究对象,利用谱系图确定聚类的个数,并构建评价函数改进初始聚类中心,聚类结果显示把31个地区分为四类比较合适,并且进一步分析发现同时优化k值和优选初始聚类中心聚类结果的类间占比率较高.最后结合我国当前的发展形势对不同类别地区提出相应的价格控制建议.  相似文献   

12.
在常规地质信息和生产开发动态资料综合分析的基础上 ,可以应用灰聚类分析法来定量评价剩余油潜力。以孤东油层七区西 6 - 1小层为例 ,提取了剩余油潜力区的有效厚度、孔隙度、含油饱和度、储层非均质系数、沉积相、构造形态、砂体位置、射孔完善程度、注采完善程度等聚类评价指标 ,建立了各指标的白化函数 ,并采用复式加权法确定了各指标的灰聚类权 ,最终判别结果以概率最大的聚类系数确定 ,从而实现了潜力井区剩余油潜力大小的定量划分 ,为矿场挖潜措施的优化选择提供了指导  相似文献   

13.
多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统计法进行了对比.实证分析表明,论文所提方法更为简单而且有效.  相似文献   

14.
模糊c-均值聚类算法(fuzzy C-means 简称FCM)和层次聚类算法是两种非常重要的聚类算法.由于FCM算法对初始聚类中心敏感,并且需要人为确定聚类类别数,这样收敛结果易陷入局部最优解.通过对这两种聚类算法的分析,首先对传统的凝聚层次聚类算法提出了改进,然后用改进的凝聚层次聚类算法得到最佳聚类数和初始聚类中心,最后用FCM算法进行再次聚类,以此得到更好的聚类结果并且减少了执行时间和迭代次数.  相似文献   

15.
以人体测量为基础,对90名年龄在18~25岁的南方地区女大学生的乳房基本形态进行研究.通过频度分析得出,南方地区女大学生胸围均值为80.2cm,比国标的中间体胸围(84cm)小,穿着的文胸号型集中在70A~70B之间.从影响女性乳房形态美的主要因素--乳间距、胸点高出发,利用SPSS统计软件将乳房基本形态分为9类,并分析其分布特点及文胸类型的选择做了分析,得出青年女性胸身比在0.71左右,乳间距与胸宽比在0.5左右;在文胸穿着上以普通型为主,其次是提胸型和侧收型,较少的人需要穿着同时具有提胸和侧收功能的文胸.为内衣企业制定文胸生产方案及女性的文胸号型选择提供参考.  相似文献   

16.
针对利用k-均值聚类算法形成发电系统充裕度评估中的聚类负荷模型时存在的聚类中心初始值和聚类数难以确定的问题,提出根据负荷水平对充裕度指标的贡献度,将负荷曲线分成高贡献度、中等贡献度、低贡献度等分区,分别采用层次聚类、均值-标准差、随机法来选择各分区中聚类中心初始值;定义改进效率指标,将改进效率作为收敛条件确定聚类数.利用本文方法所得的聚类负荷模型,采用状态抽样法计算IEEE RTS79电力系统可靠性测试系统的发电系统充裕度指标.算例结果表明,同采用基于传统k-均值聚类方法的负荷模型结果相比,基于混合聚类方法得出的负荷模型的计算结果更精确,收敛速度更快.  相似文献   

17.
基于模糊C均值聚类和减法聚类结合的图像分割   总被引:1,自引:1,他引:0  
针对模糊C均值聚类算法(FCM)聚类过程中,初始聚类中心通过随机产生、类别数的确定通过预定义的方式实现的问题,利用减法聚类(SCM)以及聚类有效性函数,实现对FCM聚类过程的聚类中心和聚类类别数自动进行设定,实现了数据的自适应聚类,并将其应用到了CT图像的自动分割中.实验结果表明,该方法是有效的.  相似文献   

18.
针对城市快速路交通状态划分问题,提出一种改进的模糊C-均值(FCM)算法.为了解决FCM算法对初始聚类中心敏感、聚类前必须对聚类数和模糊加权指数给出恰当赋值等问题.首先采用减法聚类得到最大聚类数及相应的初始聚类中心,然后基于模糊决策的方法优选参数m,最终将聚类有效性函数融入FCM聚类,动态确定交通状态的分类.对上述方法通过Matlab6.5编程得出结果,对比分析表明提出的方法能够提高城市快速路交通流状态的分类效果.  相似文献   

19.
【目的】在没有先验知识的前提下,采用基于粒子群优化算法(PSO)的加权模糊C-均值(WFCM)聚类算法,从30多万条记录的医疗保险数据中挖掘出疑似医疗保险欺诈的记录。【方法】首先,引用改进的欧式距离、相似性函数以及交叉熵函数并通过PSO算法极小化交叉熵函数,对属性权重进行分析;其次,选取Calinski-Harabasz(CH)有效性指标,展开聚类有效性的研究;然后,基于数据预处理的结果将数据运用于PSO算法,不断更新得到各属性的权重,并运用聚类有效性评价中的CH有效性指标来动态估计最佳聚类个数,提高FCM聚类的速度;最后,将属性权重和最佳聚类数应用于FCM聚类算法,根据隶属度矩阵聚类得到疑似医疗保险欺诈结果。【结果】基于上述研究方法,本研究根据最后的隶属度矩阵来进行聚类分析。【结论】将优化的权重应用于加权FCM聚类算法与聚类有效性评价,既提高了聚类算法的高效性,又避免了主观评价对分类的影响。  相似文献   

20.
为精准有效地预测电商客户粘性,提升经济效果,研究数据挖掘技术在电商客户粘性预测中的应用。利用可变网格的K-means聚类算法,聚类获取电商客户粘性预测相关数据;通过有效性指标优化可变网格K-means聚类算法的聚类数,确定最佳聚类数,提升数据聚类效果;采用技术接受模型,依据聚类获取的数据,建立电商客户粘性预测指标体系;通过模糊层次分析法,结合指标体系,建立电商客户粘性预测模型,获取预测分值。实验结果表明,该模型可有效确定最优聚类数,精准聚类电商客户粘性预测相关数据;所建立的预测指标体系的指标相关性较低,结构较稀疏、较全面。总体说明,该模型可有效预测电商客户粘性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号