首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于遗传算法的可变加权FCM聚类方法改进研究   总被引:2,自引:2,他引:0  
模糊C均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感.利用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行了确定,然后在FCM法中引入指标权重,并给出迭代公式和相应算法.实验结果表明,该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好.  相似文献   

2.
针对传统FCM算法无法获得令人满意的聚类结果的问题,提出了基于样本与特征双加权的自适应FCM聚类算法。采用特征和样本双加权的策略,以特征权重信息熵作为代价函数,与样本权重、特征权重相融合,通过迭代优化的方法动态计算各属性特征对不同类别的权重系数、每个样本对聚类的重要性权重值,综合考虑各个样本的贡献度和各个特征的重要性,从而达到提高聚类结果质量的目的。使用5个来自UCI的标准机器学习数据集,对聚类算法的有效性进行验证。结果表明,对于具有不同样本贡献度和不同特征重要性的数据集,提出的算法具有较好的聚类效果。  相似文献   

3.
缺失数据是指数据集中存在未观测到的值.以往研究中很少涉及到对不完整离散数据的统计过程监控问题,为了对缺失数据进行监控,采用4种插值方法来处理缺失数据集,分别是均值插补(MS)、线性回归插补(RG)、随机线性回归插补(SRG)和多重插补(MI).在仿真中,考虑在5种不同的缺失率下控制图的整体发出失控信号概率,从而比较基于...  相似文献   

4.
提出一种基于模糊c均值(FCM)和BP神经网络的棉麻纤维识别方法。首先,根据纤维横向和纵向截面形态的不同,提取6个特征参数,然后运用模糊c均值算法将样本聚类成3类,再将聚类后的数据作为BP神经网络的输入进行训练和预测,最后进行仿真实验。结果表明,将两种算法结合起来用于纤维的识别具有明显优势,是值得推广的纤维识别方法。  相似文献   

5.
针对电子商务中顾客满意度影响因素的分析,提出一种基于RFM模型评分方法和聚类技术的影响因素分析方法 .首先,利用有序加权平均(OWA)方法来获得RMF模型中各变量的权重.然后,利用RFM模型对顾客的购买行为进行分析,给出各项评分,并使用模糊C均值(FCM)聚类技术对顾客进行聚类.接着,通过将每个聚类组的RFM值与平均RFM值进行比较,以此来发现流失的顾客类型.最后,对这些客户进行问卷调查来获得顾客不满意的主要因素.通过一个案例分析,提出方案能够准确找到顾客不满意因素,为电子商务公司提供有力依据.  相似文献   

6.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

7.
介绍了FCM聚类分析理论,并在此基础上给出了改进模型.根据2000—2009年的全国农村居民收入的数据对31个省、市及自治区农村居民收入变化进行了比较研究,利用改进后的FCM聚类模型进行了分类.所用方法和所得结论对研究我国农村居民收入的变化具有一定的参考价值.  相似文献   

8.
针对传统局部离群数据检测算法时间复杂度高、参数鲁棒性差的问题,在基于连接的异常因子(Connectivity based outlier factor,COF)算法的基础上,提出了一种基于聚类和密度的局部离群数据检测算法。利用聚类方法从原始数据集中筛选出候选离群数据集,来降低算法的时间复杂度;在进行数据对象之间距离计算时,引入信息熵的概念确定数据对象的离群属性,以提高算法的检测准确率。确定数据集的离群属性后,采用新的局部链接离群因子(Local connectivity based outlier factor,LCOF)度量候选离群数据集中数据的离群程度。此算法在保证检测准确率的前提下,降低了时间复杂度和检测准确率对参数的依懒性。仿真结果证明了所提方法的有效性和可行性。  相似文献   

9.
采集了正常人足底压力的数据,统计分析了行走过程中摆动相5个阶段的压力分布关系,指出采用模糊理论方法能够更好地对足底压力分布模式进行识别.在实验统计的基础上采用拟合方法得出表征足底压力大小的隶属度函数,结合实验数据固定了FCM算法的聚类中心,精简了算法,能够快速确定受试者处于步行状态中的何种支撑相,并对该算法进行仿真验证,实验结果验证了该方法的可行性.  相似文献   

10.
为了提升分类模型对非平衡数据的分类性能,提出一种EMWRS(expectation-maximization weighted resampling)抽样算法和WCELoss(weighted cross entropy loss function)损失函数,在数据预处理阶段采用高斯混合模型得知数据分布特点,根据其聚类结果分析每个聚类簇中样本权重,以及样本分布和对应权重对数据进行采样,降低数据集不平衡程度;再依据样本比例权重对少数类和多数类赋予不同的代价损失,构建卷积神经网络模型,提高非平衡数据集的分类准确性。构建的卷积神经网络以F1和G-mean为评价指标,在UCI(university of California irvine)公共数据集adult上与SMOTE(synthetic minority over-sampling technique)和ADASYN(adaptive synthetic sampling)等多种经典算法进行比较,结果显示在这两种评价指标中所提模型均为第一,这表明改进后的卷积神经网络模型能够很好地提高少数类分类正确率。  相似文献   

11.
通过对基因表达数据的聚类分析能够较快地发现肿瘤细胞,较为准确快速地诊断疾病。本文在稀疏主成分的基础上,研究了基于稳定稀疏主成分的基因表达数据聚类分析方法的问题。改进的方法主要应用于解决稀疏主成分的Lasso方法在高维度中缺乏变量选择的一致性。使用直接聚类、主成分聚类、稀疏主成分、稳定稀疏主成分四种聚类方法对2个基因表达数据进行K均值聚类和层次聚类,比较方法的准确率,验证了基于稳定稀疏主成分的基因表达数据的聚类分析方法的准确度更高。  相似文献   

12.
为了处理大量分布式存储的农业环境数据,提高农业生产效率,对高斯混合模型聚类算法进行了改进,提出了一种基于分布式聚类的农业环境数据异常检测方法.在Spark分布式计算框架下,首先对数据进行粗聚类,得到初始化模型;然后利用Spark迭代更新模型直至稳定,其中Map阶段将样本点分配到模型,Reduce阶段更新模型个数及参数;最后利用聚类结果,实现环境异常值的检测.实验结果表明该方法可行有效.  相似文献   

13.
基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。  相似文献   

14.
针对锌银电池分选成组后一致性的问题,提出了基于最小二乘支持向量机(LS-SVM)和模糊C均值聚类(FCM)的锌银电池分选方法。该方法利用FCM对锌银电池进行聚类分析,以电池放电电压平台的三个不同时刻电压作为输入,电池的聚类结果作为输出,建立LS-SVM模型,利用训练好模型预测电池分选结果。实验结果表明,此方法得到的电池组动态一致性好,容量衰减率明显降低,在30次循环寿命测试后容量衰减率不超过10%。此分选方法分选效率高、建模速度快,可有效识别组内电池样本的一致性,实现电池的多场合利用和效率最大化。  相似文献   

15.
提出一种样本之间相似系数确定的方法,用相似度矩阵替代传统的相似矩阵,近而确定初始聚类中心.在FCM法中引入了指标权重,并给出了迭代公式和相应算法.将改进后的FCM法应用到煤炭城市分类的实例中去,聚类结果对处在经济转型时期的煤炭城市相互借鉴发展有一定的参考价值.  相似文献   

16.
无线传感器网络(Wireless Sensor Networks,简称WSNs)是一种多跳、自组织式的网络,传感器节点在能量、通信能力以及计算能力等方面均受限,并且在数据传输过程中也存在安全隐患,基于此提出了一种基于K-means聚类的安全高效的数据聚集算法KSEDA(K-means Safe and Efficient Data Aggregation).该算法采用K-means聚类算法对传感器节点进行分簇,通过分析节点的剩余能量进行选择簇头节点;并在向汇聚节点Sink传递过程中通过安全多方计算协议进行数据安全聚集.通过与CPDA算法进行实验对比,算法具有低能耗、高安全性等特点.  相似文献   

17.
列举了有关基于聚类融合的不平衡数据分类的办法,可以解决少数类的识别率很低,利用传统分类手段予以解决.利用此种方法能够发现,引入少数类边界区域与在多数类核心当中的样本聚类一致性系数,并且分别对欠抽样方法对少数类与多数类的训练集.  相似文献   

18.
针对传统协同过滤算法因未考虑用户与项目之间的对偶性而产生的数据稀疏问题,提出一种基于双聚类技术和Top-n推荐技术的新型协同过滤算法:通过同时对行之间和列之间进行聚类,可以对用户和项目之间的相似性进行辨识,从而确定二者的分组信息;利用Top-n算法快速、精确地搜索出最佳的服务推荐.为了验证所提方法的有效性,在网络服务数据集上进行了相关实验.实验结果表明提出的方法能够在存在稀疏数据的情况下为用户提供有效的推荐,提高网络服务推荐的搜索精确性,提升CPU的有效利用率,并大幅度增强了算法的鲁棒性.  相似文献   

19.
针对现有数字高程模型(digital elevation model, DEM)数据空洞填充算法存在修复效果不连续、适用空值范围狭小以及细节重构丢失等问题,提出了一种融合自注意力机制的生成式对抗网络的DEM空洞填充方法。首先,构造自注意力机制提取DEM数据特征信息,改善DEM空洞填充结果高程值不连续和纹理细节缺失的问题。其次,在生成器中使用对称结构的卷积与反卷积网络结构,保证生成可靠度较高的数据以实现空洞区域填充,并利用判别器实现空洞填充结果的预分类。最后,结合重构损失函数进行训练,提升DEM空洞填充结果对异常值的鲁棒性,增强模型的回归能力。采用不同分辨率DEM数据进行空洞填充并与现有方法进行对比,结果表明:所提方法能够大幅提升填充精度,有效解决原始数据中存在的空洞问题。  相似文献   

20.
结合现实中数据表现出复杂的多流形特点,对多流形假设下的学习算法进行了研究。利用多种聚类算法对不同类型的数据进行聚类分析,得出每种数据类型下的最优聚类方法。仿真结果表明,采用规范化切割谱聚类方法可将独立子空间高维数据成功分类;SSC算法对线性子空间聚类效果表现最佳;引入LLE的Ncut聚类算法和SMMC算法对于非线性数据的多流形聚类具有较好的效果;SSC算法和SMR算法对高维子空间聚类问题表现出较好的适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号