首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
基于Minkowski泛函和K-means聚类算法的岩石类型划分   总被引:1,自引:1,他引:0  
数字岩心技术的发展和计算科学、物理学、统计学、油藏工程等多学科的交叉融合,为基于数字岩心图像的岩石类型的精细划分提供了一种新的方法。基于micro-CT物理法成像处理后获得的砂岩数字岩心图像,运用闵可夫斯基泛函作为基于数字岩心图像的岩石物性特征的综合表征参数;并结合K-means聚类算法,可以达到基于数字岩心图像的岩石类型的精细划分和获得基于精细岩石类型层次系统的目的。对于后续基于精细岩心层次系统岩心物性参数的模拟和粗化具有十分重要的意义。  相似文献   

2.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

3.
针对宏观路网区域交通状态预报需要首先产生路网区域的需求,提出了一种新的基于交通指数聚类的路网区域动态划分方法.首先对整个城市路网进行网格化划分,将路段划分为从属于某个网格的子路段;然后,计算每个网格的交通指数,提取网格特征,从而得到样本特征矩阵;接着,利用k-means++聚类算法对样本特征矩阵进行聚类,得到初始聚类标...  相似文献   

4.
区域变电站具有数目众多、类型多样、线损构成及节电特性复杂的特点。为提升区域变电站节电研究效率,实现区域变电站节电特性的科学划分,文中提出了一种基于模糊c-均值聚类(FCM)的变电站节电划分的方法.首先,设计一套变电站节电划分综合指标体系,包括涵盖变电站主变容量、主变台数等基本参数的基本属性指标子体系和涵盖输送电量、站用电量等电气参数的电气属性指标子体系;其次,依据各指标对变电站的损耗及其节电特性的影响程度,应用层次分析法(AHP)确定各指标权重,建立AHP-FCM的变电站节电划分模型;然后,分别应用所设计的节电划分综合指标体系、基本属性指标子体系和电气属性指标子体系从3个不同的角度运用AHP-FCM实现区域变电站的划分,通过对3种节电划分结果及其聚类中心矩阵分析研究,获得对各类变电站损耗及其综合节电特性的深入认识,为变电站后续的研究提供参考依据和重要指导;最后,以某区域90个变电站的实际数据进行实例分析,验证了所提方法的实用性和有效性.  相似文献   

5.
针对监测范围内空间相关性较强的监测站点数量难以确定这一问题,提出基于K-means聚类算法对各空气质量监测站点进行区域划分的方法.以南通市为例,在选择目标区域内历史污染物数据的基础上,结合该区域的气象数据,利用由卷积神经网络(convolutional neural network,CNN)和长短时记忆网络(long ...  相似文献   

6.
为加强用户对水印的嵌入数量、嵌入强度、数据选择的控制,提出一种基于带大小约束聚类的数据库水印方案,分析了类别数量对水印嵌入之后数据可用性的影响。在传统的模糊C均值聚类方法的基础上加入条件约束,使原始数据划分为均衡的n类。在各类别数据中用户可以用密钥控制选取其中几类数据嵌入水印。在水印嵌入之前可以根据水印的稀疏程度设置比例参数,体现用户控制版权的原则。实验表明,方案有较好的可行性和鲁棒性,并且安全性有了一定的提高。  相似文献   

7.
针对"拍照赚钱"项目的任务定价,综合运用K-means聚类算法、相关性分析等方法,分别构建了任务定价模型、任务完成率的分析模型。用MATLAB和EXCEL软件求解,发现当会员数量一定时,完成任务的距离越远,任务定价越高;当完成任务的距离一定时,会员数量越少,任务定价越高;在会员数量足够多的前提下,任务定价越高,任务完成度越高。进一步深入分析未完成任务,利用最小二乘法给出更合理的定价模型。  相似文献   

8.
基于进化策略的K-means聚类算法   总被引:3,自引:0,他引:3  
针对K-means聚类算法易陷入局部极小以及K值选取的问题,提出一类基于进化策略的聚类算法,可以有效地搜索最优聚类中心和聚类个数K;还提出了确定K值范围的经验公式,以减小搜索空间,提高搜索效率,并给出了理论分析.相对遗传算法而言,本方法鳊码简单,种群较小.对Fishers iris数据集的仿真实验表明,该方法得到最优解的可能性比经典算法大得多.  相似文献   

9.
针对现有(Rival Penalized Competitive Learning,RPCL)算法之不足,提出根据样本数据集自然分布规定样本密度,把此密度代入次胜者受罚竞争学习算法(RPCL)节点权值调整的改进RPCL算法;以改进RPCL算法对数据集进行预处理,确定K-means算法的合理类簇数目和最佳初始聚类中心,提高K-means算法的聚类效率和聚类准确性,促进其尽快地收敛至全局最优解。  相似文献   

10.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域.本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中.高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教.首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作.  相似文献   

11.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域。本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中。高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教。首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作。  相似文献   

12.
13.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

14.
针对信息安全风险评估训练数据少、求解最优值困难等问题,提出了基于互信息和K-means聚类的信息安全风险评估方法.用模糊评价法量化风险指标,通过互信息计算风险因素与风险等级之间的依赖性,找出风险度在每个等级的最优点作为K-means初始中心点,用K-means算法对数据分类.该方法实现简单且克服了 K-means对初始...  相似文献   

15.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

16.
K-means算法是聚类方法中常用的一种划分方法.基于扩展划分的思想,提出了一种基于扩展的K-means聚类算法(EK-means),在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K-means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况.该算法使用了基于距离的技术来处理孤立点,引进了一种基于扩展的方法进行聚类.实验表明该算法可扩展性好,能够很好的识别出孤立点或噪声,并且有很好的精度.  相似文献   

17.
基于信息熵改进的 K-means 动态聚类算法   总被引:3,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

18.
对纺织品彩色印花图像进行颜色区域分割.将彩色纺织品印花图像转换到CIEL*a*b颜色空间,用K均值聚类分析算法对描述颜色的a*争b*通道进行聚类分析;通过提取各个颜色区域独立成为单色的新图像,对彩色纺织品印花图像进行分割处理.实验结果表明,在CIE L*a*b空间使用K-means聚类算法可以有效地分割彩色纺织品图像的颜色区域.  相似文献   

19.
K-means聚类算法简单,收敛速度快,但是聚类算法的结果很容易受到初始聚类种群的影响,往往导致局部最优。差分进化算法具有很强的全局收敛能力和鲁棒性,但其收敛速度较慢。为此,将K-means聚类算法和差分进化算法相结合,提出一种基于K-means的改进差分进化聚类算法。该算法设置在一定范围内随迭代次数动态增加的交叉算子,以使算法在迭代过程中先进行全局搜索,再进行局部搜索,这样有助于平衡算法的全局寻优和局部搜索能力,并且加快了算法的收敛速度。最后,通过实验测试了算法的有效性。  相似文献   

20.
针对大数据环境下聚类算法所处理数据规模越来越大、对算法时效性要求越来越高的问题,提出一种基于分布式计算框架Spark的改进K-means快速聚类算法Spark-KM.首先针对K-means算法因初始聚类点选择不当导致局部最优、迭代次数增加而无法适应大规模数据聚类的问题,通过预抽样和最大最小距离相结合对K-means算法进行改进;然后对原始数据进行矩阵分割,并存储在不同的Spark计算框架的结点当中;最后根据改进的K-means算法,结合分布式矩阵计算和Spark平台进行大数据快速聚类.结果表明,文中算法可以有效减少结点间的数据移动次数,并具有良好的可扩展性.通过该算法在单机环境和集群环境的对比测试,说明该算法适用于大规模数据环境,且算法性能与数据规模成正比,集群环境较单机环境也具有很大的性能提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号