共查询到17条相似文献,搜索用时 609 毫秒
1.
基于分层聚类的k-means算法 总被引:8,自引:0,他引:8
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。 相似文献
2.
3.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法. 相似文献
4.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳... 相似文献
5.
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性. 相似文献
6.
一种改进的K means聚类彩色图像分割方法 总被引:1,自引:1,他引:0
图像分割是从图像处理到图像分析的关键步骤.图像分割的目的是将图像分割为多个互不重叠且又各具特性的区域,主要应用于图像压缩、目标提取、模式识别等.以往的图像分割技术主要应用于灰度图像,随着计算机技术的进步,彩色图像分割逐渐受到关注.该文在前人对彩色图像分割问题的大量研究成果基础上,提出了一种将K-means聚类、蚁群算法以及分水岭算法相结合的分割方法.本方法有效的克服了聚类数目必须依据先验知识提前设定、最初的聚类中心是随机选取的、聚类的效果好坏依赖于距离判定公式的缺陷. 相似文献
7.
8.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法. 相似文献
9.
10.
11.
结合上下文特征和图割算法的车载点云聚类方法 总被引:1,自引:1,他引:0
可靠、准确的点云聚类是后续高精度场景目标分析与解译的基础.该文提出了一种基于上下文特征和图割算法的车载点云聚类方法.首先用DBSCAN (density-based spatial clustering of applications with noise)对点云数据进行过分割,得到密度可达的超体素;然后引入空间和属性上下文特征来描述超体素间的关联,并用于定义超体素构建的图模型边的权值;最后基于多标记的图割优化算法得到最佳超体素聚簇.实验结果表明,该方法能够有效改善点云聚类过分割,从而提高聚类的精度. 相似文献
12.
13.
近几年来,单元化制造系统(CMS)作为一种由于能满足不同客户需求、缩短产品生产周期、提高企业的全球竞争力的先进制造组织模式而备受关注。本文提出了一种新的矩阵聚类方法(HERBAL)设计制造单元,并探讨了该方法与其它聚类方法如ROC、ROC2、DCA等方法在成组效率、成组功效等评价指标上的优劣,证明了该方法的可行性和高效率。同时该方法中的设备_零件矩阵(MCM)中的二元值元素,采用反映实际生产中的流程时间替代,可使聚类结果更符合实际的生产需求。 相似文献
14.
15.
PBC:一种基于路径的XML文档聚类方法 总被引:2,自引:0,他引:2
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度. 相似文献
16.
17.
针对基于模板的目标跟踪算法存在模板冗余高、难以适应非刚性目标外观多变的问题,提出一种基于粒子滤波的模板在线聚类目标跟踪方法.首先建立用于描述目标和背景的正、负模板集,然后抽取候选粒子,使用候选粒子与正、负模板集的类内距离以及正、负模板集之间的类间距离来构建似然函数,最后依据最大后验概率准则确定最佳候选粒子作为跟踪结果.根据视频序列中连续变化的目标状态,将一定范围内的相似目标状态视为一个状态类,确定当前状态类的聚类半径.采用均值漂移算法对正模板集及最近几帧跟踪结果进行聚类,并将聚类后的中心集作为新的正模板集.实验表明,该算法能保留目标不同的外观状态,在复杂情况下仍能准确跟踪目标. 相似文献