首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 173 毫秒
1.
数据挖掘领域中的聚类方法   总被引:4,自引:0,他引:4  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

2.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

3.
提出了一种相对简单、有效的划分复杂网络社团结构的方法.该算法利用复杂网络的转移矩阵P和K均值聚类算法来划分社团结构,并且用F统计量判定最优的聚类结果,在探测社团结构明显的人工网时具有较高的准确度.  相似文献   

4.
为解决k-means聚类算法和k-凝聚聚类算法对于非凸形状数据聚类正确率低和模糊核聚类算法(FKCM)收敛速度慢的问题,将k-凝聚聚类算法与核函数方法相结合,在高维特征空间构造了新的核聚类算法--核k-凝聚聚类算法,实现了k-凝聚聚类算法的核化.通过Matlab编程进行数值实验,证明了核k-凝聚聚类算法在聚类的准确性、稳定性、健壮性等方面较之k-means聚类算法、k-凝聚聚类算法和FKCM有一定程度的改进.  相似文献   

5.
复杂系统故障诊断中的模糊聚类方法   总被引:25,自引:3,他引:22  
为了提高复杂系统故障的诊断能力,采用模糊C-均值聚类算法对原始采样数据进行聚类,并通过模糊传递闭包法和绝对值指数法得到模糊C-均值法的初始迭代矩阵.用划分系数、划分熵和分离系数来评价聚类的结果是否最佳.采用模糊聚类方法可避免研究复杂系统的内部特性,比仅依据其外部输出的数据进行故障诊断方法简便.通过某飞行器测试系统的应用,表明采用模糊聚类方法后,提高了判别故障的准确率.  相似文献   

6.
基于遗传算法的模糊聚类方法   总被引:1,自引:1,他引:1  
针对模糊c 均值算法容易收敛于局部极小点的缺陷 ,将遗传算法应用于模糊c 均值算法的优化计算中 .算法采用实数编码 ,提高了试验精度 .实验证明基于遗传算法的模糊聚类方法能够在一定程度上克服初值的影响 ,跳出局部极小点 ,在大样本的聚类方面有较大的优势 .  相似文献   

7.
基于类内距离参数估计的文本聚类评价方法是在类内距离近似服从正态分布的基础上,运用极大似然估计方法对类内距离分布函数的参数进行估计,然后基于估计的结果确定类内距离的合理取值范围,对超过范围的文本向量依据类内距离大小依次进行调整,并利用聚类评价指标来验证最终调整结果。在实验部分文章通过使用基于类内距离参数估计的文本聚类评价方法对K-means算法生成的聚类结果进行调整,一方面验证了在聚类类别数过小或与真实类别数相同时,该方法的可行性;另一方面减弱了初始类中心的选取对K-means算法的影响,提高了聚类结果的准确性。  相似文献   

8.
在原有基于可扩展函数族聚类的基础上,提出了自适应可扩展函数族概念,对原来的算法CIFF和CDFF作了改进,将阈值理论与可扩展函数族相结合,设计了新的聚类算法,并对其聚类性能作了分析。实验结果表明,用自适用可扩展函数族方法进行聚类,不但使聚类在可伸缩性、增量数据处理及复杂数据类型处理等方面都表现出很好的性能,而且与原算法相比,具有聚类精度高、速度快等优点。  相似文献   

9.
分割较复杂的二维灰度图像时 ,采用塔型模糊C -均值聚类 (PFCM)方法 ,由于该方法充分利用了图像的灰度信息和空间信息特征向量 ,因此比仅只利用图像的灰度信息来进行图像分割的图像信息熵分析法效果要好 .而且 ,在稳定性、收敛速度方面 ,该方法优于非塔型模糊聚类算法 .  相似文献   

10.
聚类分析是重要的数据挖掘方法,在商务智能、地理信息系统、医学等方面有广泛的应用.随着聚类分析的蓬勃发展,涌现出了许多聚类算法,其中最重要的算法之一是基于密度的空间聚类以及其多种变种——基于密度连通链、基于加权密度、基于引力连通集合的算法.这些算法在概念上相似但没有统一的描述.本文针对基于密度的空间聚类及其变种提出了拓扑的概念.给出了聚类拓扑结构的定义,把簇定义为拓扑连通集合.此外,本文运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法.实例证明此算法有效.  相似文献   

11.
在分析传统的聚类算法优越性和存在不足的基础上,基于Chameleon算法和谱平分法的思想提出了一种新的聚类方法。相比传统聚类算法而言此算法克服了如k—means算法、EM算法等传统聚类算法在聚类不为凸的样本空间时容易陷入局部最优的缺点,能在任意形状的样本空间上聚类,且收敛于全局最优解,并且可以降低噪声和离群点的影响,提高了算法的有效性。在UCI数据集和5个特殊的二维数据点组成的数据集上进行了实验,证明了本方法的有效性。  相似文献   

12.
基于统计空间映射的模式识别及在线质量推断   总被引:1,自引:1,他引:0  
采用回归分析的方法,建立特征变量与产品质量之间的统计对应关系,把产品质量表达成特征变量的回归函数,进而得到特征空间与产品质量空间在统计意义上的映射关系,在产品质量空间进行聚类,在特征空间进行分类,而后提出了一种基于统计空间映射的在线模式识别方法。利用唐钢烧结厂的实测数据进行了仿真,验证了本方法的正确性。从算法分析和仿真结果看,这一算法可以有效地克服模式交叉现象的影响,并可对复杂生产过程进行在线质量推断。  相似文献   

13.
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

14.
如何提高数据匹配的精确率,正确率以及效率,使匹配流程自动化是数据库领域的一个热点问题。文章提出了一种metrics空间下的数据匹配新方法。方法基于三角不等式原理,对数据分类匹配比较,并引入多重循环机制提高匹配效率。文章分析了方法的复杂度,并实验验证了方法的有效性。实验结果表明,方法能够有效的匹配结果的精确率和正确率和效率。  相似文献   

15.
基于LSI和自组织神经网络的高效文本聚类方法   总被引:4,自引:0,他引:4  
根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了文本聚类的精度和速度.  相似文献   

16.
随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变.因此,客户划分显得至关重要.采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程.通过电信客户的数据实验结果表明,算法的时间复杂度降至 O(N) 级别.  相似文献   

17.
一种非监督道路场景分割方法   总被引:1,自引:0,他引:1  
针对道路场景分割中训练样本量大、不同类型道路过渡中易产生误分割的问题,该文提出了一种非监督的道路场景分割方法。首先用K均值聚类对第一幅图像进行初始化分割,再用图割法对其进行能量最小化的优化分割,最后用优化后的分割图像重新计算类别中心,用于指导下一帧图像的图割优化分割。实验表明,该方法无需大量训练样本,可以快速地对道路场景进行分割,还能够在不同的道路类型过渡过程中保持很好的分割效果。  相似文献   

18.
在对山峰聚类和减法聚类进行分析之后提出了一种通过划分网格、规约数据、减法聚类3步完成的聚类算法.仿真试验表明,此方法较之山峰聚类,减法聚类能明显减少计算量,提高聚类的速度.  相似文献   

19.
提高电波折射修正精度的关键是提高雷达测试场区大气空间结构精度.本文提出了下垫面复杂地区在雷达电波射线经过区域内进行多点大气探测的新方法——区域法.结果表明,在下垫面复杂地区最好使用区域法测量大气空间结构.  相似文献   

20.
假设β1α1 0,β2α2 0。文章对如下定义的强奇异积分算子Q乙2f(x-t, y-s, z-γ(t)h(s))t1e+α1,γ(t), h(s)满足某些适当的条件。利用振荡积分估计,得到当β1 3α1 0且β2  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号