共查询到20条相似文献,搜索用时 46 毫秒
1.
针对最大最小值原则的Kmeans聚类算法运行在Hadoop平台时需要多次遍历所有数据的问题,提出了一种改进的初始聚类中心的选择算法称为M+Kmeans算法。该算法只需要遍历一次全局数据极大的缩减了算法并行运算时消耗的时间。多组实验测试结果显示,设计的M+Kmeans算法适合运行在大规模集群Hadoop平台上,并且加速比和扩展率较原始算法有明显提高。 相似文献
2.
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考. 相似文献
3.
虽然聚类与分类算法的研究应用已很普遍,但在入侵检测领域把二者结合起来进行研究分析的情况并不普遍,因此,提出了一个分层的聚类与分类算法混合模型,并通过K—Means聚类算法、改进的差分进化算法与最近相邻分类算法为例对入侵数据集样本进行聚类与分类,最后得出有效的实验结果。 相似文献
4.
采用以平面为原型来拟合样本的思想设计学习机,已在机器学习和数据挖掘等领域引起广泛关注,然而,如何利用少量标记样本,兼顾平面原型特点实现聚类,鲜见报道.以kPC(k-Plane Clustering)为切入点,在有标样本极端少的情况下,设计了半监督型平面聚类算法semi-kPC.考虑到L1范数较L2范数更为鲁棒的事实,在... 相似文献
5.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进... 相似文献
6.
为了改善蝙蝠算法在函数优化中稳定性差,易陷入局部最优的问题,利用云模型随机性和稳定倾向性的特点,提出了一种蝙蝠优化算法,根据个体适应度值,利用K-means聚类算法把种群划分为三个区域,分别采用不同的频率生成策略,使算法既能稳定的控制搜索空间范围,又能避开局部最优解,同基本的蝙蝠算法比较,仿真结果表明,该算法在函数优化问题中具有较高的精度和较快的搜索速度. 相似文献
7.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。 相似文献
8.
Gustafson- Kessel( GK) 聚类算法可以有效地搜索超椭球、平面和线型的数据类,但仍然存在对初始聚类中心较敏感、易于陷入局部最优的缺陷.为此,文中根据鱼群觅食与聚类的相似性,利用人工鱼群( AFS) 算法对聚类中心进行初始化,提出了改进的G- K 聚类算法,并利用人工数据集和IRIS 数据集进行仿真研究.结果表明,文中算法能有效地发现数据集中的聚类结构,聚类效果优于GK 聚类算法. 相似文献
9.
基于随机抽样和聚类特征的聚类算法 总被引:5,自引:0,他引:5
在分析BIRCH算法不足的基础上,提出了一种基于随机抽样和聚类特征的聚类算法(CLAP),该算法采用随机抽样技术,从数据库中抽取一部分数据进行聚类的预处理过程,这样大大降低了运行时间,CLAP通过设立索引树的叶节点的直径和聚类直径,提高了聚类的精度,并采用全局搜索和局部搜索相结合的方式,消除了输入顺序对聚类质量的影响.测试结果表明,CLAP算法不仅提高了聚类速度,而且改善了聚类质量。 相似文献
10.
本文的目标是寻找具有更高灵活性和自适应性的颜色聚类方法,在分析了多种颜色聚类方法的基础上,提出了2种无监督的二维色度平面颜色聚类方法,基于密度的三角化方法和遗传算法优化方法,并通过实验对2种方法进行了比对分析,结果表明,基于密度的三角化方法具有很好的边界拟合效果,而遗传算法优化对于复杂的数据集和解决干扰噪声有更好的效果。 相似文献
11.
语音识别中的VQ聚类方法 总被引:1,自引:0,他引:1
梁虹 《云南大学学报(自然科学版)》1998,20(6):467-468,472
介绍了一种新的VQ聚类分析-修正Kmeans算法,该方法充分利用了语音的先验知识,聚类后仍能较好地保留汉语辅音段及过滤段的有用信息,还介绍了为解决VQ聚类的无时序性与语音信号序列的有时序性之间的矛盾而采用的多节VQ聚类方法。 相似文献
12.
萨北开发区北部过渡带四条带主要发育萨I组、萨Ⅱ组油层,研究区块中水平井B5-8-A53开采目的层SⅡ2 3层,SⅡ2 3层以下为油水同层或水层。目前阶段,水平井B5-8-A53的含水率有很大上升,水平井周围注水井点少,注采关系完善程度低,因此,水平井B5-8-A53周围注水井调整和油井转注问题仍需进一步研究。本文通过多种技术综合研究,加深对油层认识程度,完善油层精细地质建模方法,建立区块精细地质模型,精确描述层内隔层、描述层内非均质性;总结地质模型粗化方法,对精细模型进行粗化;再通过数值模拟研究,对区块含水率和水平井含水率、地质储量进行了拟合,并在剩余油分布研究的基础上,结合建立的地质模型选出打井的井位,并对打井方案进行预测和优化,找出水平井B5-8-A53开采效果最好的单井最佳方案,把单井最佳方案进行组合,优选出最佳的组合方案;为油田特高含水期的水平井B5-8-A53开发提供技术保证。 相似文献
13.
Kmeans算法是一种基于样本相似度的聚类分析算法。金融IC卡推广是重要的国家发展战略。本文利用Kmeans算法探索山东省金融IC卡城市推广规划,有效加强了方案的准确性和针对性。 相似文献
14.
为了解决传统方法大多将注意力放在建筑群体局部优化方面,缺少对整个含多障碍建筑群体空间布局优化研究的问题。通过改进粒子群法研究多障碍建筑群图像空间布局智能寻优方法优化问题。建立寻优问题模型,将最小化最大风速比、最大化采光满足率、最优化容积率作为多障碍建筑群图像空间布局智能寻优目标,依据寻优问题模型建立总目标函数。针对粒子群算法的弊端,对其进行改进;将粒子和种群最优粒子差异程度当成依据对权重进行确定。通过密集距离对粒子和相邻粒子间的密集程度进行描述,依据密集程度,选用逐一去除法对最优解进行更新。针对提出的多障碍建筑群图像空间布局多目标寻优问题,采用改进粒子群算法进行求解。结果表明:采用所提方法优化后,日照满足率虽然略低于优化前;但最大加速比和容积率均更优;所提方法 WBGT指标(湿球黑球温度)高于其他方法。可见所提方法可令各指标均衡最优化,能够保证新陈代谢率低,热适应差的人舒适性。 相似文献
15.
采用Fluent软件与RNG(Re-normalization group) k-ε湍流模型,数值模拟我国东南沿海地区常见的一类带檐口低矮曲面四坡屋面的风压.重点分析了屋面坡角、风向角、檐口类型等参数对四坡屋面平均风压及周围风场的影响.研究表明,上述参数与屋面风压都密切相关.随屋面坡角增大,迎风屋檐处峰值风吸力减小,背风面风吸力增大;配置檐口可显著改变屋面子块区域的平均风压系数,从而使屋面抗风性能得到优化. 相似文献
16.
旋挖钻机成孔的显著优势备受关注,但实际钻孔很难达到理想的破岩效果,揭示复杂地层赋存环境的钻头破岩机理是关键。文中基于Boussinesq问题的求解,得到动力头压力和扭矩作用于截齿时的岩石受力及位移,推导截齿破岩时的侵入力及切削力表达式。建立单截齿破岩的三维数值模型,获得钻头钻进中截齿的侵入力及切削力变化规律,对比理论结果以验证数值模型的可行性。基于旋挖钻机双截齿破岩过程的数值模拟,分析钻进中的岩体力学响应及裂纹演化以揭示截齿的破岩机理,探讨不同截齿布置的旋挖钻机破岩力特征,阐明截齿倾角或偏斜角增大都将不同程度地改变破岩力大小。进一步分析截齿布置方式与不同类型地层组合的破岩效率,结果表明,截齿倾角或截齿偏斜角或截齿间距相等时,由软到硬地层的破碎比功逐渐增大,且钻进某一地层的破碎比功先减小后增大,存在最优的截齿布置使得钻进效率最高。研究成果可为旋挖钻机截齿设计的优化和破岩效率的提高提供理论依据。 相似文献
17.
钻孔卸压是解决冲击地压有效方法之一。为了研究布孔参数对卸压效果的影响,采用RFPA2D数值模拟软件,模拟钻孔直径、钻孔间距、钻孔深度、应力对卸压效果的影响。通过模拟及理论分析,得出在其他外界因素一定的条件下,卸压效果随孔径的增大而提高;钻孔时煤体中的应力越大,卸压效果越显著的论断。模拟结果表明:煤岩体在高应力状态35 MPa下,钻孔直径200 mm时,钻孔间距为3.5 m,钻孔直径400 mm时,钻孔间距为4.5 m卸压效果好;在一般应力状态25 MPa下,钻孔直径200 mm时,钻孔间距为2.0 m,钻孔直径400 mm时,钻孔间距为3.0 m卸压效果好。 相似文献
18.
19.
高层建筑群风场的数值分析 总被引:10,自引:0,他引:10
针对高层建筑物风场和风压力的问题,采用计算流体动力学(CFD)软件对高层建筑物进行模拟,得出了单个建筑物在不同风向下的风场和风压力,并对高层建筑群进行了模拟,将其分布规律与单个建筑物进行了比较,结果表明,风在受到第一个阻碍后的区域里的漩涡分布最强烈,压力梯度最大,是最危险的受力区,在建筑群中,最靠近迎风面的建筑物所受负压最大,且建筑物之间的间距也对风场有很大影响,因此研究结果对于减少高层建筑物中大尺度的漩涡脱离区,以及降低室内噪声具有指导价值,同时也显示了CFD技术强大的分析能力及其在工程应用领域中的广阔前景。/ 相似文献
20.
针对某多热源工业厂房室内高温的问题,提出全面通风和局部送风两种优化方案,并运用计算流体力学方法对改造前后厂房的热环境进行模拟.研究结果表明,增加局部送风主要是改善人员活动区域的热环境.增强全面通风使室内的整体热环境得到改善,同改善效果更为明显,并且可以有效的节约能源.原厂房工作区平均温度为38.9℃;平均风速为0.43... 相似文献