首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对高分辨率极化SAR数据特征分布不再符合同质区域假设, 进而导致基于统计分布的极化SAR影像非监督分类方法精度下降的问题, 将具有广泛适用性的KummerU分布嵌入粒子群寻优聚类算法, 提出了新的极化SAR影像非监督分类算法(PSO-KummerU方法):首先基于极化SAR统计特征对数据进行初分类, 然后采用极化SAR统计特征与粒子群优化算法进一步进行聚类中心求解, 分类准则部分采用KummerU距离改进代替传统的Wishart距离度量准则; 采用3种非监督分类方法(H/α-Wishart、PSO-Wishart、PSO-KummerU方法)进行分类对比实验.实验结果表明:基于KummerU分布的PSO-KummerU方法与采用Wishart距离的聚类方法相比, 目视效果明显改进, 整体分类精度提高14%以上.  相似文献   

2.
针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSC-SN(text soft classifying based on similarity threshold and non-overlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSC-SN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类.  相似文献   

3.
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。  相似文献   

4.
In accordance with the specific deployment way of infrastructure and data exchanging technology in the Internet of vehicles(IoV),the acquiring and calculating method for three basic traffic flow parameters in IoV scenarios,including traffic flow,speed and density,was researched.Considering the complexity of traffic flow and fuzziness of human thinking,fuzzy c-means clustering algorithm based on the genetic algorithm(GA-FCM) was adopted in soft classification of urban road traffic conditions.Genetic algorithm(GA) introduced into fuzzy clustering could avoid fuzzy c-means(FCM) algorithm converging to the local infinitesimal point,which made the cluster result more precise.By means of computer simulation,data exchanging environment in IoV was imitated,and then test data set was divided into four parts.The simulation indicates that the identification method is feasible and effective for urban road traffic conditions in IoV scenarios.  相似文献   

5.
KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对样本数据进行聚类处理,用形成的子簇代替该子簇所有的样本集,以减少训练集的数量,从而减少KNN分类过程的工作量、提高分类效率,使KNN算法更好地应用于数据挖掘.通过理论分析和实验结果表明,论文所提算法在面对较大数据时能有效提高算法的效率和精确性,满足处理数据的需求.  相似文献   

6.
At present, studies on training algorithms for support vector machines (SVM) are important issues in the field of machine learning. It is a challenging task to improve the efficiency of the algorithm without reducing the generalization performance of SVM. To face this challenge, a new SVM training algorithm based on the set segmentation and k-means clustering is presented in this paper. The new idea is to divide all the original training data into many subsets, followed by clustering each subset using k-means clustering and finally train SVM using the new data set obtained from clustering centroids. Considering that the decomposition algorithm such as SVMlight is one of the major methods for solving support vector machines, the SVMlight is used in our experiments. Simulations on different types of problems show that the proposed method can solve efficiently not only large linear classification problems but also large nonlinear ones.  相似文献   

7.
为实现较高层次的遥感影像分类及有效去除高维特征的信息冗余,以 Sentinel-2 遥感影像为数据源,应 用 CatBoost 算法对龙江县进行了面向对象的土地利用分类。利用 CatBoost 算法对全部特征集进行降维,分别使 用 CatBoost、RF(Random Forest)和 AdaBoost 算法进行土地利用分类并对分类结果进行对比。研究结果表明, CatBoost、RF 和 AdaBoost 算法的 Kappa 系数均在 0. 77 以上,且 CatBoost 算法的 Kappa 系数高达 0. 911 4。因此 CatBoost分类法是土地利用分类的有效方法,为土地类型的划分提供了快捷可行的方法。  相似文献   

8.
球磨机制粉过程煤粉粒度FCM-SVRs软测量建模   总被引:1,自引:0,他引:1  
根据多个模型相加可以提高整体预测精度和鲁棒性的思想,提出了一种基于模糊C均值聚类(FCM)算法的煤粉粒度多最小二乘支持向量机回归(MLS-SVRs)软测量模型.采用变长度染色体的遗传算法同时优化模糊聚类数和聚类中心,每种聚类子集用LS-SVRs进行局部模型的建立和训练,再用模糊聚类后产生的隶属度将各子模型的输出加权求和得到最后软测量结果.仿真结果表明该软测量模型具有更好的泛化结果和预测精度,可以满足煤粉制备过程实时控制的在线软测量要求.  相似文献   

9.
针对交通监控图像识别精度较差的问题,设计一种基于径向基(radial-basis)函数神经网络的图像分类器.该分类器利用Zernike矩噪声敏感度较小、形状特征稳定性好的特点,构建四阶矩的特征向量,用于特征提取;利用自适应模糊聚类方法,解决径向基函数神经网络隐层节点数不确定的问题.仿真分析表明,该分类器与基于改进的快速模糊C均值聚类算法的Back Propagation网络分类器和径向基函数神经网络分类器相比具有更高的识别率,与改进的粒子群优化模糊C均值聚类算法的径向基函数神经网络分类器相比具有相近的识别率,但其计算复杂度较低.仿真实验结果表明,该方法具有较好的分类能力及较高的计算效率.  相似文献   

10.
基于颜色信息与区域生长的图像分割新算法   总被引:1,自引:0,他引:1  
提出了一种新的结合了颜色特征与区域生长的彩色图像分割算法B-JSEG.该算法是在彩色图像分割的JSEG算法和边缘检测中的方向算子的基础上实现的.根据已有算法的缺陷,利用新的参数描述纹理颜色信息,并通过区域增长和合并来获得最后的分割结果.由于在JSEG算法中加入了方向算子,同时考虑了区域的相似性和边界的非连续性,减少了过分割.大量图像的实验结果表明,所提出的算法具有很好的鲁棒性,比JSEG算法更符合人类的视觉感知.  相似文献   

11.
针对传统图像特征降维方法计算量大、 无法去除冗余信息、 未考虑相关性等缺陷, 提出一种结合快速主成分分析(FPCA)和ReliefF算法的图像特征降维方法. 该方法先利用FPCA[KG*6]算法对样本数据进行初次降维, 去除样本中的冗余信息;  再利用ReliefF算法计算样本特征的分类权重, 根据权重对特征进行组合优化. 在算法实现过程中, 采用递归排除策略, 进一步提升了算法特征寻优能力. 仿真实验表明, 利用本文算法优选出的图像特征, 可较好地提高聚类结果, 适合实际工程的应用.  相似文献   

12.
检索效率和准确率是基于内容的图像检索技术的重要指标.首先采用一种改进的软聚类算法在颜色空间进行聚类预处理.在此基础上,提出一种快速有效的提取基于离散余弦变换的能量矩特征方法,对聚类结果进行基于能量矩特征的二次检索.实验结果表明,聚类预处理能大大地缩小图像的搜索范围,以达到快速、准确检索图像的目的,同时提出的分块能量矩对图像旋转、尺寸变化及噪声有较强的鲁棒性.  相似文献   

13.
鉴于传统制造业企业仓储分类方法分类边界不明确、难以适应现代企业信息化发展趋势的问题,提出了基于聚类算法的ABC库存分类算法,提升了传统库存分类模型的分类精度和效率。以某电力制造业企业的库存产品数据为研究对象,结合聚类算法与ABC分类法提出了适用于实际研究场景的评价函数,并给出了新的基于k-means 算法的ABC分类法。采用该分类模型对库存环网柜产品进行分类,并基于ERP系统中存储的产品数据将库存环网柜产品分为A、B、C三类,根据分类结果对不同类别的环网柜产品采取不同的库存控制策略。研究结果表明,将数据挖掘算法应用于库存管理实现了企业库存管理决策的科学化和智能化。  相似文献   

14.
基于核模糊C均值的异常检测方法   总被引:1,自引:1,他引:0  
探索聚类方法在异常检测中的应用,提出了一种基于核的模糊C均值的异常检测方法.该方法使用核的模糊C均值对网络数据进行聚类,并使用基于簇内距离的判断规则对聚类结果进行标定,从而识别出攻击.使用KDD CUP1999数据集进行实验,结果表明本文表现出了高检测率和低误报率的良好性能.  相似文献   

15.
针对传统Mashup服务推荐在网络构建方式的成本和计算复杂性过高问题, 提出一种基于半监督层次聚类描述的Mashup服务推荐算法. 首先, 利用网爬工具收集ProgrammableWeb上的Mashup服务信息, 并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式, 以此作为研究分析的数据集; 其次, 为提高聚类精度, 提出一种半监督层次描述聚类算法, 通过植入层次聚类算法顶层核心集方式, 有效解决了传统层次描述聚类因顶层分类集构造失败而影响Mashup服务推荐算法的准确度. 通过在聚类数据集和网爬Mashup服务数据库上的实验表明, 该算法的Mashup服务推荐准确率优于对比算法.  相似文献   

16.
针对各类网络数据中存在着大量的无标记数据,导致了SNS(social network service)隐私保护中数据可用性相对较差的问题,本文提出一种基于Bagging的ELM(extreme learning machine)集成算法,并将其与基于Seeds集的半监督聚类算法相结合应用于隐私保护.该算法首先利用ELM-Bagging集成方法对无标记数据进行标记,并将新标记的数据加入Seeds集以扩大其规模,然后采用基于Seeds集的半监督聚类实现K-匿名.实验结果表明,该算法在有效保护隐私的同时,提高了发布数据的可用性.  相似文献   

17.
针对岩芯图像的粒径分析提出了一种基于K-均值聚类算法的半自动分割算法,并编写了一套颗粒粒度图像处理程序.首先将超像素处理概念应用于岩芯偏振显微图像,得到过度分割的结果,然后对分割结果进行K-均值聚类和区域融合,利用图像中的边缘信息得到了更合理的结果,并大大提高了运算的速度;根据提出的算法,基于VB.NET 2008平台构建了一套半自动岩芯图像粒度分析软件,集图像采集、图像处理、粒度参数分析、砾石种类分类以及测量报告输出等功能于一体,大大提高了岩芯粒径分析的工作效率.  相似文献   

18.
针对动态选择集成算法存在当局部分类器无法对待测样本正确分类时避免错分的问题,提出基于差异聚类的动态SVM选择集成算法。算法首先对训练样本实施聚类,对于每个聚类,算法根据精度及差异度选择合适的分类器进行集成,并根据这些分类器集成结果为每个聚类标定错分样本区,同时额外为之设计一组分类器集合。在测试过程中,根据待测样本所属子聚类及在子聚类中离错分样本区的远近,选择合适的分类器集合为之分类,尽最大可能的减少由上一问题所带来的盲区。在UCI数据集上与Bagging-SVM算法及文献[10]所提算法比较,使用该算法在保证测试速度的同时,能有效提高分类精度。  相似文献   

19.
一种基于模糊C均值的新分类算法   总被引:1,自引:0,他引:1  
以两种初始化类中心的选择算法为基础, 对传统聚类算法模糊C均值算法进行改进, 提出一种基于模糊C均值的新分类算法NFCM, 解决了数据分类问题, 并采用UCI上的标准数据集中多个常用数据集进行实验测试, 实验结果表明, 对于UCI上标准数据集的常用数据具有较好的分类结果.  相似文献   

20.
设计一种基于AP聚类算法和SVM分类器相融合的新的混合分类器, 使用AP聚类算法优化数据集, 得到了高质量、 小样本的SVM分类器训练集. 实验结果表明: 与传统的SVM分类器相比, 混合分类器具有更高的分类精度; 在心脏病预测上, 该分类器的效果较好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号