共查询到18条相似文献,搜索用时 421 毫秒
1.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳... 相似文献
2.
3.
4.
针对基于模板的目标跟踪算法存在模板冗余高、难以适应非刚性目标外观多变的问题,提出一种基于粒子滤波的模板在线聚类目标跟踪方法.首先建立用于描述目标和背景的正、负模板集,然后抽取候选粒子,使用候选粒子与正、负模板集的类内距离以及正、负模板集之间的类间距离来构建似然函数,最后依据最大后验概率准则确定最佳候选粒子作为跟踪结果.根据视频序列中连续变化的目标状态,将一定范围内的相似目标状态视为一个状态类,确定当前状态类的聚类半径.采用均值漂移算法对正模板集及最近几帧跟踪结果进行聚类,并将聚类后的中心集作为新的正模板集.实验表明,该算法能保留目标不同的外观状态,在复杂情况下仍能准确跟踪目标. 相似文献
5.
《黑龙江大学自然科学学报》2016,(6)
结合现实中数据表现出复杂的多流形特点,对多流形假设下的学习算法进行了研究。利用多种聚类算法对不同类型的数据进行聚类分析,得出每种数据类型下的最优聚类方法。仿真结果表明,采用规范化切割谱聚类方法可将独立子空间高维数据成功分类;SSC算法对线性子空间聚类效果表现最佳;引入LLE的Ncut聚类算法和SMMC算法对于非线性数据的多流形聚类具有较好的效果;SSC算法和SMR算法对高维子空间聚类问题表现出较好的适用性。 相似文献
6.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法. 相似文献
7.
8.
9.
基于分层聚类的k-means算法 总被引:8,自引:0,他引:8
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。 相似文献
10.
脑核磁共振图像常常受到噪声的影响,且有灰度不均、边界模糊的特点,使得传统聚类算法无法获得理想的脑部肿瘤分割结果,为此提出一种基于边缘保持滤波和改进核模糊聚类的脑肿瘤图像分割方法.该方法首先采用改进的引导滤波算法对图像进行预处理,解决平滑图像时不能保留图像边缘的问题;然后将传统核模糊C-均值聚类算法(Kernel fuzzy C-means clustering)中的单一高斯核函数替换为混合高斯核函数,将数据由低维空间映射到高维特征空间;最后将马尔科夫随机场的先验概率引入,对算法的目标函数进行修正,进一步增强算法的抗噪性.实验结果表明,所提方法在去除噪声的同时,能够有效保留图像的边缘信息,PSNR值相比传统算法提升0.804 1~2.096 2 dB,SSIM值相比传统算法提升0.031 2~0.065 4,且算法分割精度更高,Dice指标和Jaccard指标的平均值分别达到0.955 1和0.914 1. 相似文献
11.
PBC:一种基于路径的XML文档聚类方法 总被引:2,自引:0,他引:2
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度. 相似文献
12.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak,CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering,DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。 相似文献
13.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果. 相似文献
14.
15.
16.
一种基于SOM和层次凝聚的中文文本聚类方法 总被引:2,自引:0,他引:2
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。 相似文献
17.
相似性测度是度量两个直觉模糊集相似程度的重要方法.文章给出一个新的直觉模糊集相似性测度,讨论该相似性测度的一些性质及得到利用该相似测度对直觉模糊集进行聚类的一般步骤,最后通过实例验证了该方法的有效性。 相似文献