首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
将数字图像处理中模糊锐化算子与三支聚类进行结合,提出了一种基于图像处理的三支聚类算法。该算法通过逆多元二次核函数将数据集的密度量化为灰度值,对数据总体采用模糊与锐化操作,提取锐化后灰度值较高的数据区域,将低密度区域从原始数据中删除。对灰度值较高的数据采用传统的聚类算法得到不同的类簇,然后对每个类簇利用图像模糊算子得到类簇的核心域,锐化算子得到类簇数据边界域,从而获得每个类簇的三支表示。试验采用不同的UCI数据集,通过比较聚类指标Adjusted Rand Index(ARI),Normalized Mutual Information(NMI)和Adjusted Mutual Information(AMI),验证了该聚类算法的有效性。  相似文献   

2.
电力负荷曲线聚类在电力大数据研究中有重要的应用。针对传统负荷聚类方法难以有效处理海量化的高维负荷数据,以及存在簇间样本模糊导致算法聚类质量不高、聚类效率低下等问题,提出一种结合多维缩放(multi-dimensional scaling, MDS)和一种新的集成簇间、簇内欧式距离的加权K-means方法(weighting k-means clustering approach by integrating intra-cluster and inter-cluster distances, KICIC)的聚类算法(MDS-KICIC)。该方法首先采用MDS算法对高维负荷数据进行数据降维处理,得到降维后的低维矩阵和归一化的特征值向量作为KICIC算法的输入矩阵和权重向量,KICIC通过在子空间内最大化簇中心与其他簇数据对象的距离来融合簇内和簇间的距离进行聚类,得到最终聚类结果。通过算例表明该方法运算时间短、聚类质量高,进一步提高了负荷曲线的聚类性能。  相似文献   

3.
针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地均摊能量消耗,提高了分簇均匀性.仿真实验结果表明,该算法降低了网络能耗,提升了网络生命周期.  相似文献   

4.
聚类是一种重要数据分析技术,在众多领域中得到广泛地应用.然而,由于数据分布的内在特点,传统的聚类算法并不能保证聚类结果具有平衡性,这与很多现实的需求不一致.本文提出了一种基于K-Means的平衡约束聚类算法,该算法对K-Means算法每次迭代中数据点的分配策略进行修改,达到对每个簇可包含的数据点数目上限进行约束的目的.同时,算法支持用户自定义簇可包含的数据点数目上限,满足不同的平衡约束聚类需求.另外,本算法参数少,只需设置目标簇数目及其可包含的数据点数目上限,时间复杂度低,具有简单、快速的特点.在6个UCI(University of California Irvine)真实数据集上进行的实验结果表明,文中提出的平衡约束聚类算法相比其他平衡约束聚类算法具有更佳的聚类效果和时间性能.  相似文献   

5.
本文面向出行GPS轨迹中停驻点的识别问题,提出一种基于最小覆盖圆的时空聚类方法。使用停驻范围阈值对轨迹点进行聚类,使用停驻时间阈值对聚类类簇进行初步过滤,使用类簇近邻距离与类簇近邻时间两个阈值对预过滤类簇进行合并,继而使用停驻时间阈值进行最终过滤得到停驻时段与停驻点。该算法改进了已有时空聚类算法中初始类簇的确定方法,提高了计算效率。由于现有的查全率与查准率无法准确衡量停驻点识别结果的精度,基于停驻时段精确度对查全率与查准率计算计算方法进行修改。使用包含9 923个轨迹点的轨迹进行算法有效性检验,轨迹中包含的三个停驻时段均得到有效识别,查准率与查全率均为0.82,实验结果表明,该算法在轨迹重合度高以及轨迹漂移等情形下具有较高的准确性。  相似文献   

6.
为了弥补K-Means算法对孤立点数据敏感的缺陷,提高K-Means算法对包含孤立点数据集的聚类效果,在深入研究K-Means算法的基础上,提出了基于PAM和簇阈值的改进K-Means聚类算法。该算法首先对待聚类数据进行抽样,然后利用PAM算法获取样本数据的聚类中心,以样本数据的聚类中心作为KMeans算法的初始聚类中心。在聚类迭代过程中动态计算各簇阈值,利用簇阈值准确地过滤孤立点数据。实验结果表明,本文提出的算法不仅聚类时间短,而且具有较高的聚类准确率。  相似文献   

7.
针对目前SVM回归算法在大样本情况下,学习效率低、精度不高的问题,提出了基于Kmeans聚类的并行SVM回归算法。在Hadoop框架中,先对训练样本行进并行聚类,然后针对聚类后的不同簇,构造相应的SVM回归模型,使用顺次最小优化算法求解各模型参数。预测时,选择与待预测样本距离最近簇的对应SVM回归模型进行预测。实验验证了文中算法的可行性和有效性。  相似文献   

8.
平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。  相似文献   

9.
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。  相似文献   

10.
为了提高在大规模流式数据环境下交通热点区域分析的算法效率,提出了一种流式数据两阶段方法;该方法在第一阶段使用基于改进Canopy算法进行粗聚类并产生宏簇,在第二阶段使用K-means算法进行细聚类;并以粗聚类产生的宏簇个数和类簇中心位置为指导产生更加准确的微簇聚类结果。在试验中,使用流式数据两阶段方法对北京市出租车的定位数据进行了聚类分析;并结合热力图和电子地图对聚类结果进行可视化表达,在最终的热力分析结果中可以直观地发现出租车活动较为频繁的热点区域和线路,且与日常出行经验相符合。试验结果表明该算法能够实时地对流式数据进行聚类分析,产生的数据结果可供用户在任意时间窗口范围进行查询分析,有助于为交通活动情况实时分析、交通规划和拥堵治理等方面提供有价值的理论参考依据。  相似文献   

11.
为了提高高速公路交通事件检测的效果,首先从交通流基本参数、交通流组合参数、不同区间交通流参数对交通事件参数的变化进行全面的分析,构建交通事件初始特征变量集,并利用AdaBoost算法、梯度提升树(GBDT)算法、随机森林(RF)算法对初始特征变量进行筛选,通过三种方法综合比较分析得出最终的重要变量.对随机森林中的决策树进行加权计算,构建加权随机森林,并利用粒子群(PSO)算法优化加权随机森林模型.通过采集的高速公路交通事件数据进行对比分析,实验结果表明,在交通事件初始特征变量中筛选出重要变量,对检测的精度有所提高,加权随机森林的检测性能也要优于传统的支持向量机(SVM)和随机森林.  相似文献   

12.
刘炼  王强  陈浩 《科学技术与工程》2022,22(11):4367-4374
针对传统基于机器学习的电力系统暂态稳定评估方法存在准确率偏低和泛化能力不足的问题,提出了一种基于特征选择和改进随机森林的在线暂态稳定评估方法。首先,通过最大化联合互信息挖掘电网运行数据之间的相关性,筛选出具有代表性的关键特征子集;然后,考虑到电力系统数据库中稳定样本与失稳样本之间的类别不平衡问题,通过改进bootstrap抽样和对决策树进行加权处理,增强随机森林对失稳样本的识别能力;最后,基于改进的随机森林算法,建立关键特征数据与暂态稳定标签之间的映射关系。实验结果表明,所提方法具有较高的准确性和较强的鲁棒性,能够满足在线应用的需求。  相似文献   

13.
针对隶属关系不明确的情况,即样本点属于多个类别的概率接近,高斯混合模型聚类存在较大的误判风险的问题,将三支决策思想融入高斯混合模型中,提出一种基于三支决策的高斯混合聚类算法.新算法计算出数据对象属于各个类簇的后验概率作为决策评价函数,用于确定聚类结果的正域和边界域.由于新算法对边界对象采取了比一般高斯混合聚类算法更加谨慎的操作,避免了直接做出对象属于某一类或不属于某一类的决策所需承担的风险,从而有效减小了误判代价.实验进一步表明,所提出的算法不仅继承了高斯混合聚算法的特点,具有良好的聚类性能,而且还对于非球形数据簇表现出优良的聚类效果.  相似文献   

14.
根据生产制造企业网络的特点,在智能故障诊断中,提出了一种基于分类采样的随机森林算法(CSRF).该算法结合随机森林算法基本原理,使用分类采样技术生成所需的训练样本,很大程度上解决了数据不均衡带来的问题.该算法为随机森林的每一棵分类回归树(CART)生成相应的训练数据,缓解了采样偏置,提高了算法的性能.实验表明:该算法与随机森林算法相比在准确率上提升了约4%,有效降低了故障诊断的风险.  相似文献   

15.
对于专利价值的不确定性和影响因素的复杂性,以及评估工作中缺乏可操作性强并且科学高效的评估方法等问题,对价值评估指标体系进行分析,并使用随机森林算法选择最有效的指标集,同时基于DBSCAN(density-based spatial clustering of applications with noise)聚类选择高精度且一致性低的决策树子森林改进传统随机森林算法,使用改进前后的两种随机森林模型在专利数据样本上进行实验并比较。结果表明,改进的随机森林模型提升了传统模型的精度,在专利价值评估中具有一定的作用,总体上比较有效地反映了专利的价值度。  相似文献   

16.
采用全站仪对野外设置的临时标准地测定4 个角点的相对坐标值和每株树木的相对坐标值,根据数据的特点,提出了消除标准地边界效应计算聚集指数的方法,并利用此方法结合定位数据,对吉林蛟河东大坡自然保护区不同发育阶段的阔叶红松林群落中林木的空间分布格局进行分析。结果表明,该群落中先锋树种占相对优势的发育阶段,林木呈聚集分布;伴生树种占相对优势发育阶段和稳定群落阶段的林木则趋于随机分布。林木由聚集分布趋向随机分布,是阔叶红松林在发育过程中树种生物学特性、树种适应对策和干扰状况共同影响的结果。  相似文献   

17.
【目的】针对随机森林算法在树木水分预测模型中高维度变量筛选困难及精度较低的问题,研究基于递归特征消除(RFE)与随机森林(RF)的融合算法,构建幼龄沉香(Aquilaria sinensis)可见光图像与叶片含水率的估测模型,探索适合幼龄沉香生长的水分条件,为实现沉香幼苗水分亏缺程度的无损监测提供可行方法。【方法】以2年生的名贵树种沉香为研究对象,用相机获取4种不同水分梯度下的幼龄沉香可见光图像,提取15种图像特征,利用递归特征消除法筛选沉香叶片最优的图像特征子集,然后结合随机森林算法构建沉香叶片含水率的预测模型,最后利用十折交叉验证法,将RFE_RF模型与常规随机森林(RF)以及最小二乘法支持向量机(LSSVM)相比较,检验模型的可行性。利用递归特征消除和随机森林融合(RFE_RF)算法筛选出幼龄沉香叶片图像的标准红光值(INR)、饱和度(S)、矩形度(ER)3个特征,并以此作为模型自变量。【结果】与重度水淹胁迫相比,幼龄沉香对于长期重度干旱胁迫更加敏感,且干旱时间超出2周时幼苗叶片严重受损,威胁沉香生长;沉香最适叶片水分生长范围为50%~65%,适度增加水分,有利于沉香生长。基于RFE_RF融合算法构建的预测模型敏感度、特异性、误报率和精度分别达到88.64%、85. 31%、14. 39%和91.62%,优于LSSVM模型效果;与RF预测模型相比其敏感度提高3.34%、特异性提高10.87%、误报率降低36.83%、精度提高13.39%。【结论】基于RFE_RF融合算法建立的沉香叶片颜色、形状特征与含水率的模型,解决了随机森林过程中高维度变量选择问题,提高了RF在林木水分预测模型中的精度,实现了沉香幼苗叶片含水率的无损估测和诊断,为珍贵树种在经营管理中对水分进行准确管控提供了新思路。  相似文献   

18.
针对现今传统统计方法难以准确及时的揭示经济参量时空信息且估算GDP精度不足的问题,本文利用国家极轨卫星携带的可见光和近红外成像辐射计(NPP/VIIRS)获取的2012-2018年夜间灯光影像为数据源,对数据产生的误差进行处理得到了可以用来定量分析的长时间序列数据;首先采用随机森林算法对数据集进行预测研究,在此基础上提出一种基于袋外数据估计的回归误差,采用改进的网格搜索算法(Grid Search)对随机森林模型进行参数调优。同时也使用贝叶斯优化(Bayesian Optimization)对随机森林(RF)模型进行参数调优。运用嵌套5F-CV,并通过外部5F-CV循环估算模型的泛化能力,内部5F-CV循环用于确定最佳参数找出最优参数模型,建立自动预测系统,根据输入的研究区数据,使算法模型自动进行精准预测。结果表明基于贝叶斯优化改进的随机森林算法在预测GDP时最好,预测精度达到97%,具有较高的准确率和鲁棒性。研究结果展示了机器学习算法和夜间光照指数用于在县级尺度上预测GDP表现出显著的能力。  相似文献   

19.
为避免无线传感器网络的能量空洞问题, 延长无线传感器网络寿命, 提出一种新的基于双簇头的无线传感器网络非均匀分簇算法. 该算法综合考虑节点剩余能量和节点到基站的距离选举分簇簇头, 将无线传感器网络分为不同规模的簇; 为了减小规模较大簇的簇头节点收集与传输数据的负担, 在数据传输阶段构造基于改进最小二 叉树的数据传输路径. 实验结果表明, 该算法能够有效减小节点能量消耗, 可有效延长无线传感器网络的使用寿命.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号