首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
提出了一种模糊C均值聚类和密度聚类算法相结合的方法对裂纹图像进行分割提取.使用标准的模糊C均值聚类算法来对原始图像进行初始聚类,得到包含裂纹区域的候选点.本文还提出裂纹狭长度与区域向量2种概念,并用来去除候选点中的伪裂纹.然后,利用密度聚类算法(DBSCAN算法)对候选点进行裂纹聚类,提取出最终的裂纹图像.实验结果证明,使用上述方法对裂纹图像进行分割提取可以得到很好的效果.  相似文献   

2.
维数灾难是数据挖掘过程中的重要问题.为解决K均值聚类过程中的维数灾难问题,本文以欧式距离作为距离的计算方式,采用主成分(PCA)方法对数据源进行降维,实验获得在不同数据规模、特征下的K均值方法的聚类时间.设置对照组对时间、差异性、迭代次数三个方面进行比较.通过实验总结出,数据源的大小与维数共同影响降维聚类的时间效益:数据数量越大,降维聚类的时间收益越大,数据维数越大,降维聚类的时间收益越小;数据源的线性程度影响降维聚类与非降维聚类结果的差异大小:数据线性程度越高,两次聚类结果差异性越小.反之,差异性越大;K均值算法收敛速度很快,两次聚类都能在Sqrt(Row)次数内完成程序的收敛.  相似文献   

3.
针对滚动轴承故障诊断中,用振动信号的总体经验模式分解(EEMD)方法分解后的熵特征向量维数高,且样本熵(SE)计算效率差等问题,提出了一种基于EEMD排列熵(PE)的主成分分析(PCA)-GK滚动轴承聚类故障诊断组合方法。首先,使用EEMD方法将信号分解为若干个固有模态函数(IMFs),使用PE/SE计算其IMFs熵值;然后,使用PCA对熵特征向量进行可视化降维,并作为模糊C均值(FCM)与GK聚类算法的输入,实现对滚动轴承的故障诊断。利用分类系数和平均模糊熵,对聚类结果进行了评价与对比,实验结果表明:本文模型(EEMD-PE-PCA-GK)的聚类效果比其他3种模型(EEMD-SE-PCA-FCM、EEMD-SE-PCA-GK和EEMDPE-PCA-FCM)更好,且PE比SE的计算效率更快。  相似文献   

4.
提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease, AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚类且只能将某个基因聚类到某一类的缺陷,改进的FastICA方法能够对基因表达数据进行快速有效的双向聚类,能够满足同一个基因可能参与不同信号传导通路的生物特性.同时考虑到人脑中海马区、内嗅皮质区、颞中回及视觉皮层区均与学习与记忆功能密切相关,将算法对多个脑区域进行基因表达调控综合分析.结果表明,大量炎症反应是AD致病的重要因素之一.  相似文献   

5.
为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集。提出基于矩阵填充(matrix completion)与模糊C均值(fuzzy c-means algorithm,FCM)相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数据的冗余信息,通过模糊C均值聚类得到具有良好的低秩特性的基因语义片段,再利用矩阵填充方法分别对每个语义片段进行缺失点的重建。在不同数据集上进行实验,与传统缺失点估计算法比较。实验表明FCM_MC算法在缺失数据估计准确度和类结构保持度上效果得到有效提升,同时运行效率较高。  相似文献   

6.
利用区间二型模糊C-均值聚类的方法,将过程数据进行聚类,并且聚类过程采用自适应的方法选择聚类数,由此区别不同的工况;利用局部切空间排列算法(LTSA)分别对聚类之后的每一类数据进行降维处理,然后利用每一类降维后的数据,使用支持向量数据描述(SVDD)的方法构建多个模型,并建立相应的统计量与统计限,完成离线建模过程。在线监控过程中首先判断过程数据属于哪一种工况,然后利用相应的模型来计算统计量并判断是否故障,利用乙烯裂解炉的过程数据进行了仿真研究,验证了方法的可行性。  相似文献   

7.
基于快速全局模糊C均值聚类算法的脑瘤图像分割   总被引:1,自引:0,他引:1  
针对经典模糊C均值聚类算法对初始聚类中心过于敏感的缺陷,提出一种快速全局模糊C均值聚类算法.该算法采用分阶段动态递增的方式选取初始聚类中心,避免了随机化设置导致的聚类结果稳定性差问题.实验分析表明,改进后的模糊C均值聚类算法在脑瘤图像分割中的聚类效果较好,多个数据集的聚类准确率也表明,快速全局模糊C均值算法的聚类稳定性明显提升.  相似文献   

8.
Parzen窗确定系数的协同模糊C均值算法   总被引:1,自引:1,他引:0  
协同模糊C均值(collaboration fuzzy C-means,CFC)算法的协同系数通常根据经验人工设定,且在协同过程中保持不变,不能充分利用数据子集之间的协同关系,算法精度有限.提出Parzen窗确定系数的协同模糊C均值(βp-CFC)算法.用模糊C均值(fuzzy C-means,FCM)算法求出各数据子集的隶属度和聚类中心,再用Parzen窗求出各子集在聚类中心处的密度,根据子集间密度的相关性设定变化的协同系数,利用变化的协同系数进行协同聚类.以Matlab为平台,对βp-CFC算法进行了实验,算法聚类准确率可达到80.34%,比模糊C均值算法、固定系数的CFC算法的准确率分别高出11.80%和3.94%.实验证明,βp-CFC算法较为合理,聚类性能较好.  相似文献   

9.
基于PSO的模糊C均值聚类算法   总被引:4,自引:0,他引:4  
在分析模糊C均值聚类算法存在不足的基础上,提出了一种新的聚类算法:基于粒子群的模糊C均值聚类算法.该算法利用粒子群强大的全局寻优能力,不仅克服了传统的模糊C均值聚类算法对初始值敏感、噪声数据敏感、易陷人局部最优的问题,而且有较快的收敛速度.试验证明,这种算法是一种很有潜力的模糊聚类算法.  相似文献   

10.
医学研究表明阿尔茨海默病(AD)的致病机制与基因有关,过高或过低的基因表达水平异常都会让人体失去平衡,产生病变.利用T检验法对基因芯片公共数据库GEO中的4种AD样本的基因芯片数据进行分析,提取出具有重要意义的显著差异表达基因,再通过这些差异基因的生物信息学分析其在AD发病机制中的作用,为AD致病机制的探询、预防、早期诊断与治疗等提供有益的途径和方法.通过该算法的筛选、结合AD发病机制的假说及基因生物学分析,最终识别出30个AD候选致病基因,其中有5个已经被确定为与AD有关,10个被AD致病基因筛选算法识别.  相似文献   

11.
双聚类作为一种无监督的学习方法,其作用是对基因表达数据进行分析.为了获取较大容量的双聚类簇,弥补传统的双聚类方法在基因表达数据一致波动性方面的不足,引入粗糙集的上、下近似集概念,将粗糙集理论运用到模糊双聚类算法中,将粗糙上、下近似集与加权均方残差相结合,得到新的粗糙均方残基,进而提出一种基于粗糙均方残基的模糊双聚类算法.针对基因表达数据集,首先进行缺失值填补;其次,用非负矩阵分解算法对基因数据集进行降维;最后,计算数据矩阵的粗糙均方残基,结合综合评判度量函数与贴近度原则对矩阵的行列进行删除和添加,得到容量更大的双聚类结果.实验结果表明,该模糊双聚类算法是有效的.  相似文献   

12.
相对于模糊C均值算法,可能性C均值(PCM)聚类方法具有更好的抗干扰能力.提出一种基于二维直方图的改进的PCM聚类图像分割方法,该方法除了考虑图像的点灰度信息外,还考虑像素点的邻域相关信息,利用改进的PCM聚类算法得到各象素点的隶属度对图像进行分割.实验表明,该方法能够对噪声图像有效地进行分割,具有较高的鲁棒性.  相似文献   

13.
模糊C均值聚类算法(FCM)由于样本模糊隶属度归一性的约束,导致FCM算法对噪声数据敏感。提出松弛模糊C均值聚类算法(RFCM),RFCM算法在可能性C均值聚类算法(PCM)目标函数的基础上,放弃了FCM算法单个样本模糊隶属度归一化约束,转为n个样本模糊隶属度之和为n的约束;并利用粒子群算法对样本模糊隶属度进行优化估计,使得模糊指标可拓展为m0的情况,同时采用梯度法得到RFCM算法聚类中心迭代公式。RFCM理论分析了算法对噪声数据抗噪的原理,解释了RFCM算法模糊指标m0的合理性,讨论了RFCM算法的收敛性。基于Gauss数据集和UCI数据集的仿真测试验证了所提出算法的有效性。  相似文献   

14.
为了提高长输管道泄漏检测的准确率,将改进模糊C均值算法应用于长输管道泄漏检测研究.在传统模糊C均值算法的基础上引入粒子群算法,对其寻找聚类中心的迭代过程进行优化,用粒子群算法替代模糊C均值的梯度下降法,以提高模糊C均值算法的聚类效率和准确率.然后分别用所得的基于粒子群优化的模糊C均值聚类模型、传统模糊C均值聚类模型以及3层BP(Back Propagation)神经网络分类模型对同一组管道泄漏检测实验数据进行处理.对比实验结果证明,基于粒子群优化的模糊C均值算法其性能优于传统的模糊C均值算法和3层BP神经网络,将其模型应用于长输管道泄漏检测的方案可行.  相似文献   

15.
软件成本数据常常表现为高维混合属性数据,传统的相似性度量已不再适用.文中通过建立软件成本数据的高维模糊C均值(FCM)聚类算法对数据相似性进行度量.首先,定义由序数属性到数值属性的初始映射;然后,通过建立改进的迭代高维FCM聚类算法对序数 数值映射进行修正,优化聚类效果;最后,利用得到的模糊划分矩阵对软件成本数据的相似性进行度量.实验结果表明,通过对聚类效果进行优化,文中定义的相似性度量能够提高软件成本估算精度.  相似文献   

16.
针对电网中录波型故障指示器上传的海量故障数据存在着大量的重复、干扰、错误及无效波形,提出一种基于稀疏自编码(sparse auto-encoder,SAE)的故障数据聚类清洗方法,该方法首先利用稀疏自编码对故障数据进行特征学习与降维,继而用主成分分析(principal component analysis,PCA)对降维后数据再次进行降维提取,实现对不同故障数据的特征获取;最后利用基于密度峰快速搜寻聚类算法(clustering by fast search and find of density peaks,CFSFDP)对故障特征进行聚类,实现对重复、干扰、错误等故障数据的聚类清洗和真实故障数据推送.提出的海量故障数据聚类清洗方法,达到了对不同类型故障数据进行清洗去冗的效果,为故障告警智能推送提供了技术支撑,提高了运维人员获取准确故障信息的效率.  相似文献   

17.
为了解决传统的协同过滤推荐算法中评分矩阵稀疏及近邻搜索耗时长导致的推荐准确性及时间效率有待提升的问题,设计了一种融合PCA降维和均值漂移聚类的协同过滤推荐算法PMCF。该算法用主成分分析法PCA保留最能代表用户兴趣的维度,以缓解评分矩阵稀疏问题;用均值漂移聚类算法在降维后的低维向量空间上对用户聚类,以减小目标用户最近邻的搜索范围。在Movielens数据集和HetRec2011-Movielens-2k数据集上的实验结果表明,PMCF算法能够有效地提升推荐结果的准确性,同时具有较高的时间效率。  相似文献   

18.
为改进传统模糊C均值(FCM)聚类算法在图像分割过程中存在线性不可分问题,使得样本与样本之间的差异小,出现处理能力弱的缺点,提出了一种将差分进化二维熵算法和核模糊C均值聚类相结合的图像分割算法,使用差分进化二维熵得到最优阈值,并用于FCM算法的初始聚类中心,解决了对初始值敏感和计算速度慢的问题,最后利用KFCM算法完成有效分割,实现了线性可分.经过实验验证,本方法运行时间短,得到了较好的分割结果.  相似文献   

19.
针对反浮选过程的被控对象复杂、数学模型不确定以及控制要求高等特点,提出一种基于主元分析和模糊聚类的数据预处理算法.采用模糊C均值聚类算法得到聚类中心,进行线形回归从而对过程变量数据进行了预处理.主元分析法则用来进行辅助变量的选取和输入高维向量的降维简化,针对主元变量采用径向基函数网络建立了系统经济技术指标的预测模型.根据工业实际生产数据进行的模型校验和误差分析表明,能够满足浮选过程控制的精度要求.  相似文献   

20.
高维数据受冗余数据和噪声数据的影响,聚类效率和准确率低,基于拉普拉斯矩阵的特征值和特征向量的特点,介绍了一种适用于高维数据的新的聚类中心选择算法,算法将拉普拉斯矩阵用于候选聚类中心选择前的数据降维处理,经过对数据进行降维处理,提高了候选聚类中心的准确性,增大了聚类准确率,扩大了聚类数据的种类范围.在10个包含不同数量样本、维度、类别数的数据集上进行了聚类分析,实验结果表明了基于拉普拉斯降维的新聚类中心选择方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号