首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为解决常用于就业数据信息分析的K-means算法中初始化聚类中心敏感和容易陷入局部最优值问题,提出了一种新的动态聚类算法.该算法首先利用最近邻聚类法获得初始聚类中心,然后利用小类对合并条件进行聚类合并,从而获得更优的聚类结果.以多个高职院校近几年的就业数据为样本信息,在数据预处理的基础上,运用提出的聚类方法进行了聚类实验分析,并挖掘出与就业质量相关的因素.最后的实验结果表明,文中提出的聚类方法聚类划分效果更优.  相似文献   

2.
一种新的层次谱聚类算法   总被引:1,自引:1,他引:0  
提出一种新的聚类算法——层次谱聚类算法.该算法在传统二分的SM谱聚类的过程中嵌入了层次聚类算法,目的是为了提高谱聚类的聚类正确率,同时又利用谱聚类纠正了层次聚类过程中所得到的歪斜划分.实验结果表明:提出的层次谱聚类算法的聚类正确率比层次聚类算法、谱聚类算法的聚类正确率都要高,同时又纠正了层次聚类过程中的歪斜划分.  相似文献   

3.
通过对传统聚类法与现代聚类法各自包含的内容进行分析研究和比较,得出了两种聚类方法的异同点,为主题演化分析中聚类方法的深入研究和发展打下了坚实基础.  相似文献   

4.
聚类分析是一种寻求客观分类的方法,它是多元统计分析中三大实用方法之一。本文首先对聚类分析的各种算法进行分类与介绍;然后总结了聚类分析在经济、生物、电子商务、保险等方面的一些应用,并对两类应用较广泛的聚类算法进行对比分析;最后结合SPSS软件,分别运用系统聚类法和 K-均值聚类法对我国31个省区经济发展水平进行分类,发现二者分类结果相同,且与我国现阶段各省各地区经济发展现状吻合度较高。  相似文献   

5.
在对山峰聚类和减法聚类进行分析之后提出了一种通过划分网格、规约数据、减法聚类3步完成的聚类算法.仿真试验表明,此方法较之山峰聚类,减法聚类能明显减少计算量,提高聚类的速度.  相似文献   

6.
在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题.尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题.结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法.在UCI数据集上的实验结果表明该方法是有效的.  相似文献   

7.
针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次划分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。  相似文献   

8.
一种基于密度和网格的高效聚类算法   总被引:1,自引:0,他引:1  
聚类已成为数据挖掘的主要方法之一,能够帮助人们在大量的数据中发现隐藏信息.目前最具典型的密度聚类算法是DBSCAN(density-based spatial clustering of applications with noise),它能够在空间数据库中很好地发现任意形状的簇并有效地处理噪声,但是它的计算复杂度相对较大.因此,采用划分数据集和聚簇合并方法,提出了一种基于密度和网格的高效聚类算法DGCA,并通过人工合成数据集和真实数据集对该聚类算法进行理论验证.实验结果表明该算法在效率性能和质量方面比DBSCAN都得到了提高.  相似文献   

9.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出.  相似文献   

10.
利用确定性退火技术的并行聚类算法   总被引:3,自引:0,他引:3  
划分聚类和分级聚类是两种基本的聚类手段。划分聚类常常可以转换为一个全局最优化问题 ,传统的划分聚类方法很难得到全局最优解。基于确定性退火技术 ,给出了解决划分聚类问题的一种算法 ,并给出了在集群系统上的并行化方案 ,推导出了参与并行计算的最佳处理机数目 ,给出了加速比的估算公式。通过模拟算例可知 ,该算法的特殊结构适合在机群系统上进行并行计算 ,特别对聚类点集相当大的聚类问题 ,由于任务间的通信开销与计算量相比很小 ,能够达到很好的并行效果  相似文献   

11.
《全国主体功能区规划》近期已由国务院正式公布,省域主体功能区相关概念内涵、区划原则和区划依据更加明晰,认为以往基于《省级主体功能区划分技术规程(试用)》的主体功能区划的一般思路需要作出适当调整.基于新的主体功能区划背景和前提条件,在总结与研究主体功能区的概念演变、当前的4+3+2分区体系的基础上,结合辽宁省的主体功能区划方案(考虑到辽宁省主体功能区划方案还需必要的调整且尚处于未公开阶段,故仅作例证使用),从省域范围内主体功能区类型确定、基础方案形成、面积比例构成及空间结构合理性判断等若干基本环节提出我国省域主体功能区划的一般思路.  相似文献   

12.
在数据挖掘领域,聚类是对数据初始的处理。动态系统中,由于经常要增加一些新的数据,如果每次对新增的数据都重新聚类,这样就既浪费时间又浪费资源。首先介绍了聚类的基本概念和聚类的分类,在此基础上提出的一种基于特征向量的聚类算法,它只对新增的数据聚类,这样就会节省大量的资源和时间。通过实验,在动态系统中对新增的数据用该增量聚类算法和重新聚类的算法相比较,最后得出结论,该增量聚类算法是可行的。  相似文献   

13.
提出一种基于小波变换的医学图像颜色特征提取新方案。根据小波变换后各子带所含的图像信息量调整主色提取种数。对低频子带,首次提出了一种适用于主色提取的无监督聚类分析方法——nova-form;而对高频子带则采用k-medoids算法。实验证明,nova-form聚类算法较经典算法有更好的聚类效果,新方案在检索速度和检索精度上能较好地兼顾。  相似文献   

14.
为了探究面向汽车主动安全技术功能验证的测试场景的科学构建方法,构建符合真实交通状况的高保真测试场景。以自动紧急制动(Autonomous Emergency Braking, AEB)系统为研究对象,以美国高速公路安全管理局事故数据库中筛选出的AEB系统功能适用的6 639起道路交通事故为研究样本,通过机器学习方法实现了由事故数据到测试场景的科学转换。针对传统聚类算法的缺陷,提出了基于层次聚类和K-means聚类相结合的融合聚类算法,并引入聚类曲线以开展事故数据样本的聚类分析。根据聚类获取的12类典型事故场景,构建了面向AEB系统功能验证的14种测试场景。研究表明:相比于传统的K-means聚类算法,融合聚类算法平均减少了8次迭代次数;聚类结果平均减少3%的波动;实现事故数据样本的科学准确聚类且提升数据聚类效率。所提出的测试场景在实现对现有AEB测试场景有效覆盖的同时,为标准测试场景的进一步扩充提供了有力支撑。  相似文献   

15.
传统模糊C-means聚类(FCM,fuzzy C-means)在处理非平衡数据集时,由于相异类中所含样本数量差异较大,导致类间权值不平衡和"均匀效应",从而易产生聚类错误.另外,FCM属于无监督方法,无法更好地利用已知的部分类标记信息引导聚类.为解决这两方面问题,提出一种半监督的平衡化模糊C-means聚类(SBFCM,semi-supervised balanced fuzzy C-means)方法.SBFCM在FCM目标函数的基础上加入了对聚类模糊隶属度矩阵的近似正交约束和半监督约束,从而得到了新的聚类目标函数.实验结果表明,相比于FCM,SBFCM能有效缓解由"均匀效应"导致的聚类错误现象,并能有效地利用部分先验类标记信息,从而可获得更好的聚类效果.  相似文献   

16.
利用动态自反馈理论改造模糊聚类过程,分析入侵数据类型及其在入侵中所起的作用,提出一种面向混合数据的自反馈模糊聚类分析算法,并用算法对KDD99数据集进行对比测试.测试结果显示,本方法能够有效提高入侵检测引擎的检测率,降低其误报率,增强计算机系统抵御入侵及自身免疫能力.  相似文献   

17.
提出了一种基于自适应模型数据库入侵检测方法(ASIDS).该方法基于矩阵和最小支持度函数的AprioriZ关联算法,依据在训练和自适应入侵检测阶段产生数据库的操作特征,用户根据实际需求动态调整最小支持度函数的值,更高效挖掘操作特征.结合层次聚类算法产生动态规则库,通过计算待检测数据操作特征与规则库中聚类的距离是否超过聚类间最大距离来判断异常,以避免已有检测系统中判断"边界尖锐"问题,并实时把正常操作特征归入动态规则库,通过对报警信息的关联分析降低误警率.实验结果表明,ASIDS能够实时地进行入侵检测,具有很高的检测率和较低的误警率.  相似文献   

18.
根据灰色聚类评估模型,构建区域旅游综合实力评价指标体系,运用灰色三角白化权函数聚类评估方法对海峡西岸经济区环三都澳区域旅游综合实力进行评价。研究表明灰色三角白化权函数聚类评估方法在区域旅游综合实力评价中有着较好的适用性,评价的结果更加科学客观,对推动区域旅游平衡发展提供了决策依据。  相似文献   

19.
 为了对动态场景下自然保护区的功能区划进行研究,集成多年的遥感、海图及野外调查数据,构建生境地理空间数据库,在遥感和GIS技术的支持下,建立了大河口区淤涨型自然保护区的功能区划框架,并给出了区划方法的一个基于离散数学的表述。在此基础上,利用eCognition面向对象的遥感影像处理技术和空间模糊评价模型,研究了崇明东滩鸟类国家级自然保护区的功能区划。结果表明:① 核心区、缓冲区1、缓冲区2和过渡区4个功能区分别占东滩保护区总面积的18.0%、13.2%、18.4%、50.4%。在空间布局和生态学意义上,都比原有功能区划更为合理;② 遥感及其派生数据的介入,在宏观尺度和长时间尺度上拓展了人们对保护区生态环境的理解,不仅降低了传统数据采集工作的强度,也增强了区划结果的时效性和科学性;③ 现代GIS技术与传统数学方法的融合可以更好地服务于保护区规划。区划结果可以为动态场景下的保护区规划管理提供科学依据。  相似文献   

20.
基于最优聚类原理的电网无功电压分区算法   总被引:3,自引:0,他引:3  
根据聚类的定义构造了多维空间的样本集,计算发电机节点对负荷节点的控制灵敏度和各负荷节点间的欧氏距离,利用聚类分析中的最短距离法对电力系统进行分区.在确定了有效分区数的取值范围后,用熵的香农函数和Sugeno-Yasukaw准则确定最佳分区数与分区有效性,并对IEEE39节点系统进行了分区验证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号