首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对选择Gap Statistic(GS)方法估计聚类数能够得到数据集的粗略分类,但不能进一步对数据集进行细分类这一问题,对GS方法进行改进;将Gap统计量引入到ISODATA算法中,提出了IGS模型;实证表明,IGS模型不仅可以实现数据的细分类,而且通过IGS模型估计数据集的最佳分类数准确率明显高于原GS模型。  相似文献   

2.
针对霰弹定型试验中提出的弹着点分布均匀性战术技术指标评价方法问题,将弹着点的二维圆内均匀性分布分解为一维径向均匀性分布和周向均匀性分布分别评价。应用MATLAB实现了一维均匀分布相容检验临界值的计算方法,该方法计算得到的不同的置信水平下各样本容量的相容性检验临界值。对一维均匀分布相容检验临界值的样本容量进行了扩展,以满足某些霰弹的弹丸数较多的实际要求。  相似文献   

3.
讨论了K-means聚类分析在人体体型分类应用时分类数的确定方法和迭代收敛两个重要问题.参考GB/T 1335—2008,以219名青年女性人体数据为检验样本,以胸腰差为实例进行论证.结果表明:采用基于系统聚类的距离评价函数法,样本最佳分类数为7类,如限制分类数为3~5时,则最优分类数为4;抽取容量分别为219和100的两组样本进行不同迭代次数的聚类分析,发现聚类收敛所需的迭代次数受数据离散程度影响,采用SPSS软件进行聚类分析时应该设定较大的迭代次数以确保聚类收敛.  相似文献   

4.
由于在高维空间中,基于固定维数的经典方法和结果不再适用,样本协方差矩阵不可逆,估计逆协方差矩阵时存在不稳定、计算成本高和非精确等问题,提出了一种L1范数最小化方法来有效估计高维逆协方差矩阵即精确矩阵.当总体分布满足指数类型条件或者多项式类型条件时,所提估计方法在各种范数下的收敛速率优于其他现存的方法.经分析验证,所提方法为凸优化问题,可采用交替方向乘子算法来解决.之后通过R语言在模拟数据和实际数据下进行仿真分析,并与Glasso方法对比逆协方差的估计性能和图恢复性能,结果表明所提估计方法准确率高、计算成本低.最后,将所提估计方法用来分析白血病数据集,并运用聚类分析对白血病人进行分类.  相似文献   

5.
本文用6种系统聚类法对30个大麦品种进行了实际分类比较,得出的结论是:类平均法分类效果最优,离差平方和法也较优,而近年来国内用得较多的最短距离法分类效果则较差。因此,提出了在品种资源分类中宜用类平均法和离差平方和法。本文还对聚类分析中的有关问题进行了讨论。  相似文献   

6.
针对传统K-means算法随机选择初始聚类中心容易造成聚类结果不稳定且准确率低等问题,基于拟蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一种新的初始聚类中心确定方法;该算法利用QMC序列分布的超均匀性特点,对整个样本空间中的样本分布进行采样估计;基于k近邻距离(k-distance)对QMC序列点进行加权的K-means聚类,得到初始聚类中心。该算法的计算复杂度为O(max(d、n)logn),其中d、n分别表示样本数据的维数和数量;在人工数据和实际数据集上的仿真实验表明,该算法能选择更优的初始聚类中心,有效降低K-means算法的迭代次数,提高聚类的准确性、鲁棒性和收敛速度。  相似文献   

7.
针对城市快速路交通状态划分问题,提出一种改进的模糊C-均值(FCM)算法.为了解决FCM算法对初始聚类中心敏感、聚类前必须对聚类数和模糊加权指数给出恰当赋值等问题.首先采用减法聚类得到最大聚类数及相应的初始聚类中心,然后基于模糊决策的方法优选参数m,最终将聚类有效性函数融入FCM聚类,动态确定交通状态的分类.对上述方法通过Matlab6.5编程得出结果,对比分析表明提出的方法能够提高城市快速路交通流状态的分类效果.  相似文献   

8.
稀有类分类在许多领域有重要应用,针对稀有类在数据中所占比例少,容易被忽略的特点,提出一种基于聚类和Ripper的稀有类分类方法,该方法在一趟聚类的结果中,通过将在整个数据集中所占的比例低于15%的聚类标识为少数类,再应用Ripper分类算法分别对少数类和多数类分别进行分类建模,并按照一定的组合方式调整得出整个数据集的最终规则集.在UCI数据集上的测试结果表明,基于一趟聚类和Ripper的稀有类分类方法对稀有类可产生高质量的分类效果.可以将该方法应用于现实生活的领域中进行稀有数据的分类.  相似文献   

9.
基于矩阵特征值分析的模糊聚类有效性指标   总被引:1,自引:0,他引:1  
许多有效性指标已经被提出量化地估计和评价模糊聚类算法对于给定数据集的划分结果.但是由于不合理的结构和极大的时间耗费,迄今这些有效性指标几乎都无法满足应用的一般性需求.为此,提出一个基于Gerschgorin圆盘定律估计的聚类有效性指标来估计模糊聚类的类数.先由模糊聚类划分的结果得到一个相关性矩阵,接着求出该矩阵的所有特征值和特征向量,然后基于经典Gerschgorin圆盘定律估计最优的类数.为了检验提出的指标在模糊聚类中的有效性,把模糊聚类算法应用到带有不同特征的3个人工数据集和3个真实的数据集,并比较提出的指标和2个最常用的模糊聚类有效性指标.实验结果证明了所提出的有效性指标能够发现被聚类数据集的固有结构,从而得出更加准确的类数.  相似文献   

10.
基于模糊聚类分析的织物质量分级方法   总被引:2,自引:0,他引:2  
织物性能的分类、分级信息是纺织品质量评估的直观表述。在织物客观评估的基础上,提出了基于减法聚类与模糊C-均值(FCM)聚类的集成方法用于纺织品质量评估分析。该方法以减法聚类算法得出的样本的最佳分类数为基础,用FCM聚类算法得到具体的分类结果。将聚类中心的特征值之和定义为分级指数,进一步用于解决织物质量的分级问题。通过对法国鲁贝高等纺织工程学院自织的43块棉针织物的分析,证明了以上方法在处理纺织品质量分类、分级问题中的有效性。  相似文献   

11.
The problem of scalable classification by clustering in large databases was discussed. Clustering based classification method first generates clusters using clustering algorithms. To classify new coming da-ta points, it finds the κ nearest clusters of the data point as neighbors, and assign each data point to the dominant class of these neighbors. Existing algorithms incorporated class information in making clustering decisions and produced pure clusters (each cluster associated with only one class). We presented hybrid cluster based algorithms, which produce clusters by unsupervised clustering and allow each cluster associ- ated with multiple classes. Experimental results show that hybrid cluster based algorithms outperform pure ones in both classification accuracy and training soeed.  相似文献   

12.
基于最小二乘支持向量机的TSK模糊模型   总被引:2,自引:0,他引:2  
为了提高模糊系统处理高维问题的推广能力, 本文提出用最小二乘支持向量回归机(LSSVR)的思想设计TSK模糊模型.TSK模糊模型的传统算法普遍存在过学习问题, 为此我们在目标函数中考虑了结构风险从而避免了过学习现象.并且,我们将模糊系统的参数寻优问题转化为一个二次规划问题进行求解.由于该规划问题的求解与输入数据维数无关,适用于处理高维数据.算法分为两步:首先用Gustafsonk-Kessel (GK)算法确定模糊规则的前件;然后用最小二乘支持向量算法确定模糊规则的后件,这里的核函数是由模糊聚类确定的, 经证明它是Mercer核.三个著名数据的实验结果表明,与TSK模糊系统的传统算法相比,本文所提的算法提高了TSK模糊系统处理高维问题的推广能力;与LSSVR相比,,本文所提的算法具有良好的鲁棒性.  相似文献   

13.
在近距空战中,实时获取可靠的空战态势信息对于决策指引是非常重要的.针对近距空战态势变化剧烈以及评估参数多维耦合的问题,提出了一种基于L-Kshape-HACA的多元空战态势分割聚类方法.以分层时序聚类分析为框架,利用拉普拉斯中心性方法确定聚类数目,同时采用Kshape对多元时间序列进行聚类分析,解决了多维参数下的态势信息提取问题.利用12组近距空战数据进行测试,并与14种聚类算法进行比较,结果表明L-Kshape-HACA在聚类中心确定和态势分割准确性上与实际空战态势更加符合.  相似文献   

14.
针对K-means++算法选取初始聚类中心计算误差平方和时, 实验次数对误差平方影响不准确的问题, 提出一种PK-means++算法. 结果表明, 该算法在进行分散数据聚类时, 在同一K值情形下, 聚类后的误差平方和较原K-means++算法更稳定, 从而更好地保证了随机实验取值的稳定性.  相似文献   

15.
针对一类具有切换结构的混杂系统,提出一种基于仿射传播聚类的模型辨识方法。将模型辨识问题等价成对系统数据的分类和分类数据的回归问题。通过仿射传播聚类算法对样本数据进行聚类划分,并分别采用最小二乘支持向量机算法对子样本分别建立模型。仿真结果验证了该方法的有效性和实用性。  相似文献   

16.
现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.  相似文献   

17.
针对K-means++算法选取初始聚类中心计算误差平方和时, 实验次数对误差平方影响不准确的问题, 提出一种PK-means++算法. 结果表明, 该算法在进行分散数据聚类时, 在同一K值情形下, 聚类后的误差平方和较原K-means++算法更稳定, 从而更好地保证了随机实验取值的稳定性.  相似文献   

18.
针对密度峰值聚类(DPC)算法存在的dc值难选择及近邻原则聚合操作在低密度区效果不佳的问题, 提出一种基于人工蜂群与CDbw聚类指标优化的密度峰值聚类(BeeDPC)算法, 以实现类簇间数据点的自动识别和合理聚类, 并解决DPC对类簇间数据点类别识别上存在的缺陷. 实验结果表明, BeeDPC算法具有自动识别并合理聚类类簇间数据点、 自动识别类簇中心点和类簇数量及自动处理任意分布数据集的优势.  相似文献   

19.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

20.
针对应用聚类方法检测入侵中参数人为指定的问题,提出了一种新的基于无监督的聚类算法.该方法不需要人为设置参数并且不受数据输入顺序的影响,聚类的形状是任意的,能够较真实地反映数据分布的具体性状.算法通过比较无类标训练集样本间的距离,根据距离最近的样本首先聚合成类的特性,在每一步聚类结束时,再次比较类间距离以及计算类内数据占总数据的比率来确定异常数据类.实验证明该算法处理未知入侵检测问题的检测率为89.5%,误报率为0.4%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号