首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 421 毫秒
1.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

2.
常用于径向基神经网络中心参数学习的K-均值聚类算法,易受初始参数选取的影响而收敛于局部极小值.将自动终止聚类判据的减聚类算法用于径向基网络的学习,可根据样本集确定径向基函数数目,且其计算量与数据点的数目与考虑问题的维数无关,很适合于人脸这种维数较高的模式.实验证明,应用这种算法训练径向基神经网络识别人脸,从识别精度到识别速度上都优于传统算法.  相似文献   

3.
图书馆大规模日志数据的快速聚类   总被引:2,自引:0,他引:2  
给出了一种简单有效的算法,用于对图书馆大规模日志数据的快速聚类和借阅趋势分析。首先,根据读者基本的借阅规律,把日志数据聚成若干子类,然后,给出了对子类结果进行再次聚类的模糊算法。最后,为了预测读者的借阅趋势,对每一类进行了回归分析。该算法具有线性复杂度,对大规模数据集是可伸缩的,实验证明是可行的。  相似文献   

4.
针对基于模板的目标跟踪算法存在模板冗余高、难以适应非刚性目标外观多变的问题,提出一种基于粒子滤波的模板在线聚类目标跟踪方法.首先建立用于描述目标和背景的正、负模板集,然后抽取候选粒子,使用候选粒子与正、负模板集的类内距离以及正、负模板集之间的类间距离来构建似然函数,最后依据最大后验概率准则确定最佳候选粒子作为跟踪结果.根据视频序列中连续变化的目标状态,将一定范围内的相似目标状态视为一个状态类,确定当前状态类的聚类半径.采用均值漂移算法对正模板集及最近几帧跟踪结果进行聚类,并将聚类后的中心集作为新的正模板集.实验表明,该算法能保留目标不同的外观状态,在复杂情况下仍能准确跟踪目标.  相似文献   

5.
结合现实中数据表现出复杂的多流形特点,对多流形假设下的学习算法进行了研究。利用多种聚类算法对不同类型的数据进行聚类分析,得出每种数据类型下的最优聚类方法。仿真结果表明,采用规范化切割谱聚类方法可将独立子空间高维数据成功分类;SSC算法对线性子空间聚类效果表现最佳;引入LLE的Ncut聚类算法和SMMC算法对于非线性数据的多流形聚类具有较好的效果;SSC算法和SMR算法对高维子空间聚类问题表现出较好的适用性。  相似文献   

6.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

7.
谱聚类是一种以图和相似性为基础的聚类新算法.当图像很大时,计算相似性矩阵及其特征值和特征向量十分耗时.为了将谱聚类算法应用于大规模聚类问题,该文提出一种两阶段纹理图像分割算法,采用改进的分水岭算法进行预分割,然后用特征值尺度化特征multiway谱聚类算法进行最终分割.为了检验算法性能,将其应用于纹理图像分割,分割结果令人满意.  相似文献   

8.
为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优化,最后用Hadoop云计算平台的Map Reduce编程模型实现算法的并行化.实验结果表明,该算法不仅在聚类结果上具有较高的准确率和稳定性,而且能够很好地解决传统聚类算法在处理大规模数据时所面临的扩展性问题.  相似文献   

9.
基于分层聚类的k-means算法   总被引:8,自引:0,他引:8  
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。  相似文献   

10.
脑核磁共振图像常常受到噪声的影响,且有灰度不均、边界模糊的特点,使得传统聚类算法无法获得理想的脑部肿瘤分割结果,为此提出一种基于边缘保持滤波和改进核模糊聚类的脑肿瘤图像分割方法.该方法首先采用改进的引导滤波算法对图像进行预处理,解决平滑图像时不能保留图像边缘的问题;然后将传统核模糊C-均值聚类算法(Kernel fuzzy C-means clustering)中的单一高斯核函数替换为混合高斯核函数,将数据由低维空间映射到高维特征空间;最后将马尔科夫随机场的先验概率引入,对算法的目标函数进行修正,进一步增强算法的抗噪性.实验结果表明,所提方法在去除噪声的同时,能够有效保留图像的边缘信息,PSNR值相比传统算法提升0.804 1~2.096 2 dB,SSIM值相比传统算法提升0.031 2~0.065 4,且算法分割精度更高,Dice指标和Jaccard指标的平均值分别达到0.955 1和0.914 1.  相似文献   

11.
PBC:一种基于路径的XML文档聚类方法   总被引:2,自引:0,他引:2  
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.  相似文献   

12.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak,CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering,DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。  相似文献   

13.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果.  相似文献   

14.
图形聚类算法的代谢网络模块化分析   总被引:1,自引:0,他引:1  
代谢网络的研究是当今生物学研究中的新热点,使用图形聚类算法对代谢网络进行分析研究是一个有力的手段.文中提出了用图形聚类方法挖掘复杂代谢网络中蕴含的功能信息并进行模块相似性分析的方法,从系统生物学角度揭示光合作用的进化.介绍了马尔可夫聚类算法和模拟退火聚类算法两种图形聚类方法;给出了两种方法对叶绿体和蓝细菌的代谢网络进行聚类的结果;定义了模块相似度评价指标,挖掘叶绿体和蓝细菌间保守的功能模块,并对其网络结构进行了比较分析.  相似文献   

15.
提出了一种基于语义的Ontology相似性计算方法,该方法不仅考虑概念本身的相似性,还考虑了属性集合和相关概念集合的相似性,通过概念基本相似性极限控制属性集合相似性计算的范围,通过语义半径控制相关概念的范围.以基于语义的Ontology相似性方法计算Ontology聚类的相似性矩阵,采用凝聚层次聚类算法实现Ontology聚类.实验表明:基于语义的Ontology聚类能够获得满意的效果,在性能上优于使用oMAP相似性方法的Ontology聚类.  相似文献   

16.
一种基于SOM和层次凝聚的中文文本聚类方法   总被引:2,自引:0,他引:2  
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

17.
相似性测度是度量两个直觉模糊集相似程度的重要方法.文章给出一个新的直觉模糊集相似性测度,讨论该相似性测度的一些性质及得到利用该相似测度对直觉模糊集进行聚类的一般步骤,最后通过实例验证了该方法的有效性。  相似文献   

18.
提取目标背景的主色是迷彩设计中的重要步骤,通常采用的颜色聚类算法具有监督性的缺陷. 为此,提出一种基于色度直方图的、无监督的颜色聚类算法. 该算法采用CIE 1931色度系统建立色度直方图,根据像素点在该坐标系的分布规律自动生成聚类中心. 逐一计算像素点与各聚类中心的色度的欧氏距离,将像素点与最近的聚类中心归于一类. 实验结果表明,采用该聚类算法能够准确提取主色,自动分割彩色图像,且比普通聚类算法的时间效率更优.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号