首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 769 毫秒
1.
针对目前流聚类算法无法有效处理数据流离群点的检测和处理,以及增量式数据流聚类效率较低等问题,提出了一种基于密度度量的异常检测、删除的增强型仿射传播流聚类算法。在仿射传播流聚类算法的基础上,所提算法通过引进异常检测和删除机制改善了异常点对聚类精度、聚类效率的影响。利用仿射传播聚类实现在线数据流的聚类过程,同时检测数据漂移现象,即数据流分布特征随时间发生变化,并采用基于密度度量的局部异常因子检测技术(LOF)对储备池数据进行异常检测和删除处理,通过对当前类簇和处理过的储备池数据重聚类来重建动态数据流模型。在真实网络数据(KDD’99)上进行了实验,结果表明,所提算法不仅减少了重聚类构建动态模型的次数,改善了聚类效率,而且在同时考虑聚类精度、纯度和熵3种聚类评价标准下,均优于传统的仿射传播流聚类算法。  相似文献   

2.
作为最小均准则的拓广,本文从数据熵,数据熵差引进最小均熵差准则,并应用于数据与模式聚类;给出基予最小均熵差准则的动态聚类算法与系统聚类算法,最后通过一个应用示例说明这一最小均熵差准则模式聚类的有效性与优越性。  相似文献   

3.
极大熵聚类算法的收敛性定理   总被引:1,自引:0,他引:1  
讨论了极大熵聚类算法的收敛性,构造了极大熵聚类算法的收敛点集,并证明了极大熵聚类算法的收敛性定理.结果表明,极大熵聚类算法不一定收敛到局部极小点,有时收敛到鞍点.同时,也给出了如何判断极大熵聚类算法的收敛点是局部极小点还是鞍点的方法.  相似文献   

4.
针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的数据点作为聚类中心,将与该聚类中心相似度大于阈值卢的所有数据点聚集形成数字颗粒结构.在整个聚类过程中无需调整每个数据点的熵值,缩短了计算时间,同时利用粗糙集的不可分辨关系形成字符颗粒结构,通过不断调整、合并这两种颗粒结构,实现了具有混合属性特征数据的聚类分析.实验结果比较表明,该算法是有效、可行的,当卢取值为0.8时,算法的聚类有效性最大值可达0.96,该值较同条件下的其他聚类算法要高。  相似文献   

5.
提出了基于分布式聚类的异常入侵检测方法ID—DC,通过对训练集进行分布式聚类产生聚簇模型,采用基于双参考点的标识算法Double—Reference标记异常簇,不需要具有类别标签的训练集且可自动确定聚簇模型的个数.实验中采用了网络入侵检测数据集KDD—CUP-99来训练模型.实验结果表明:通过采用分布式聚类算法建立的分布式入侵检测模型可有效地检测攻击,检测率高,误警率低.  相似文献   

6.
聚类已经被用来提高文本检索或文本分类效率和效果的一种手段,我们在本文中提出层次聚类算法是依据KL测度构造一组聚类,其实质是最小条件熵聚类,通过用结构α-熵代替香农熵推广最小条件熵准则,当α=2时,基于结构α-熵最小熵测度与最近邻方法的误差率相等.实验结果表明,HKLC算法比其它算法在文本聚类中具有良好性能.  相似文献   

7.
针对滚动轴承故障诊断中,用振动信号的总体经验模式分解(EEMD)方法分解后的熵特征向量维数高,且样本熵(SE)计算效率差等问题,提出了一种基于EEMD排列熵(PE)的主成分分析(PCA)-GK滚动轴承聚类故障诊断组合方法。首先,使用EEMD方法将信号分解为若干个固有模态函数(IMFs),使用PE/SE计算其IMFs熵值;然后,使用PCA对熵特征向量进行可视化降维,并作为模糊C均值(FCM)与GK聚类算法的输入,实现对滚动轴承的故障诊断。利用分类系数和平均模糊熵,对聚类结果进行了评价与对比,实验结果表明:本文模型(EEMD-PE-PCA-GK)的聚类效果比其他3种模型(EEMD-SE-PCA-FCM、EEMD-SE-PCA-GK和EEMDPE-PCA-FCM)更好,且PE比SE的计算效率更快。  相似文献   

8.
文章以PDCA质量改进模型为基础,构建了实训教学评价指标体系;依据灰色熵权聚类理论,建立了实训教学质量评价模型。实证研究表明,基于灰色熵权聚类的实训教学质量评价模型,权重结果客观,评价效果良好,可有效衡量实训教师的综合教学水平,对提升教师实训教学能力有促进作用,对完善高校实训教学体系有参考价值。  相似文献   

9.
模糊熵描述了一个模糊集的模糊性程度.本文将模糊熵应用于聚类有效性的分析.指出用于聚类有效性判决的划分系数是一个基于模糊熵的聚类有效性判决准则.最后通过几组数据对不同模糊熵公式的判决功能进行了比较实验.  相似文献   

10.
研究了基于可能性熵理论的聚类问题.首先定义并讨论了可能性熵,继而将可能性熵引入聚类分析,提出了可能性熵聚类算法.它考虑到熵聚类的全局和局部效应,具有清晰的物理意义和数学特征.该算法还能在聚类过程中自动地确定分辨率参数,克服了对于噪声和外围点的敏感性.仿真实验证明,即使各类大小不一,数据集被强噪声所污染时,该算法仍能有效地估计各类中心.  相似文献   

11.
为了提高降雨量插值精度,充分挖掘降雨变量信息,利用模糊熵聚类分析算法,对流域内雨量站进行模糊熵聚类研究,通过基于可能性分布和距离判定的聚类有效性函数确定模糊熵系数和聚类数,从而得到模糊聚类结果,改进原有的插值方法。以淮河流域蚌埠站以上区域99个雨量站雨量数据,分别在一般情况下和模糊熵聚类情况下做交叉验证,结果显示,模糊熵聚类分析在反距离平方插值法中对降雨精度有所提升。  相似文献   

12.
作为最小均方差准则的拓广,本文从数据熵、数据熵差引进最小均熵差准则,并应用于数据与模式聚类;给出基予最小均熵差准则的动态聚类算法与系统聚类算法,最后通过一个应用示例说明这一最小均熵差准则模式聚类的有效性与优越性。  相似文献   

13.
针对图像非监督变化检测算法进行了研究,提出了一种新的检测方法. 基于差异图像的三维直方图聚类特性,利用改进的一维最大熵寻找三维直方图最佳的平面阈值和平面方向;由其共同确定三维直方图的最佳划分平面,将三维直方图划分成变化聚类和非变化聚类;再根据三维直方图聚类划分结果完成差异图像的变化检测. 理论分析和实验结果表明,该方法相对传统检测方法具有更好的检测性能.  相似文献   

14.
博客聚类是处理博客信息的有效方法,提出基于评论修正的博客页面聚类算法.首先分析博客所包含的信息层次结构,然后利用博客页面的通用属性构建博客属性模型,基于博客属性模型对博客页面进行聚类,并且在初次聚类的基础上利用博文的评论对聚类结果进行修正.采用通用的熵和纯净度来衡量聚类结果,根据评论利用方式的不同,设计了两种实验方案:一个实验直接使用评论参与聚类,另一个将评论作为聚类后的修正手段.实验结果对比表明,在大多数情况下,利用评论作为修正手段的聚类效果要优于直接利用评论参与聚类.  相似文献   

15.
本文采用熵权法这种客观赋权方法来确定综合评价中各指标的权重,通过把熵权法和传统的ISODATA聚类方法相结合,在ISODATA的目标函数中引入权重,给出了含有熵权的ISODATA聚类的迭代公式,提出了基于模糊聚类和熵权的改进的综合评价算法,并将该算法应用于教师绩效评价,使其评价结果更加有效.  相似文献   

16.
基于信息熵识别油气层和水层的聚类方法   总被引:4,自引:0,他引:4  
简要地介绍了不确定性、信息熵、联合熵、条件熵、互信息的基本概念。将地层含有某种流体属性(如油层)的特征参数的概率分布应用于联合熵中,提出其概率分布是特征参数X与流体的特征参数Y的距离函数,再用熵与条件熵之差计算得到的互信息去识别地层的流体属性,即提出了基于信息熵识别油气层和水层的聚类方法。利用实际测井资料提取了油气层和水层的特征参数,并利用聚类方法识别出油气层和水层。识别结果与试油结论相符。该聚类方法不仅可用于识别油气层和水层,还可推广应用于划分地层岩性等领域。  相似文献   

17.
针对网络入侵检测与聚类等问题,提出了一种综合模糊聚类与改进的SOM神经网络方法.通过对网络入侵数据提取、分析和处理,建立了网络入侵检测聚类模型,并对传统SOM网络层次进行改进,结合易发的网络入侵类型有针对性地对网络入侵数据进行聚类.网络入侵检测聚类与其他方法比较的结果表明,该模型在网络入侵检测聚类中具有更高的准确性和均衡性,该方法能有效提高网络入侵分类精度,减少聚类误差.  相似文献   

18.
《河南科学》2017,(11):1867-1871
借鉴信息熵的思想,对灰色综合聚类法进行改进,提出了综合灰色熵权聚类评估法.该方法依据系统自身状态确定客观权重,将客观权重和主观权重相结合,确定指标的综合权重,充分考虑了各聚类系数对聚类结果的影响.利用综合灰色熵权聚类评估法对16家上市银行的经营绩效进行综合评价,结果显示,我国上市银行经营绩效整体处于较好水平,改进后的综合灰色熵权聚类法具有较好的应用价值.  相似文献   

19.
边缘信息指导下的半模糊聚类图像分割方法   总被引:2,自引:0,他引:2  
提出了一种利用边缘信息的半模糊均值聚类的图像分割算法,它先用边缘检测和区域生长算法对图像进行一次预分割,确定聚类的初始参数,然后在这个基础上对“边缘”部分的点采用模糊聚类、非“边缘”部分使用分明聚类,避免了模糊聚类时初始参数设定的盲目性,减少了迭代时的计算量,提高了迭代收敛速度.除灰度特征外,聚类时还利用了点到类的距离特征,较好地保持了分割图像的连续性.直接观察对比多幅图像的分割实验结果可以明显地发现,该算法较常用的Cksu方法、二维熵阈值分割方法以及FCM方法的分割结果更准确.就Lena图像而言,该算法的收敛速度也比一般的FCM快了将近一倍.  相似文献   

20.
为了得到FCM聚类多阈值分割中最佳聚类个数,针对Bezdek熵在数字图像数据聚类有效性判别中的不足,提出一种改进的聚类有效性判别函数.新函数通过在Bezdek划分熵中增加补偿项来突出最佳聚类时的函数值,提高有效性判别的正确性.试验结果表明,基于改进初始隶属度矩阵生成方法的FCM算法,计算迭代次数为传统FCM方法的55%,计算用时减少了约45%,而且由改进聚类有效性判别函数得到的最佳聚类数目和试验图像相符,效果明显优于Bezdek熵方法,由最佳聚类数得到的分割图像能够体现目标绝大多数信息,证明了本算法的有效性和正确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号