首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
提出了基于惩罚约束问题的群体智能聚类算法PCSI,不必穷尽搜索样本集,利用粒子群算法的优化搜索机制在数据集中有指导地随机搜索聚类中心向量,能够以较小的计算代价确定样本集的类别数.有约束优化过程的罚函数为两部分之和:①目标函数,各样本与其类别中心的均方误差;②自适应惩罚项,即数据集的边界作为粒子群移动的约束条件,对约束违反程度进行惩罚.为降低不平衡数据集的影响,按照数据集的方差和模糊高斯函数,将样本到其类别中心的距离进行模糊映射,归一化到[0,1]区间.粒子群优化方法免去了传统方法的求导计算.聚类IRIS数据集和Reuters-21578文档集以验证算法的有效性,对大规模数据聚类有明显优势.  相似文献   

2.
针对桥梁锈蚀数据难获取、锈蚀病害数据集小的问题,基于生成对抗网络(GAN)对桥梁锈蚀数据集进行扩增,并采用IS和K均值聚类算法验证其有效性.采用扩增后的数据集,按4∶1的比例划分为训练集和验证集,分别对U-Net网络和DeepLab-V3+网络进行训练,对比分析2种网络对于锈蚀分割的精度、召回率及F1分数.结果表明,采用深度卷积生成对抗网络(DCGAN)生成虚拟数据集的IS值达到2.41,分类肘形图类别数为5,与原数据集吻合,可作为扩增数据集以提升模型泛化性;DeepLab-V3+网络模型在验证集上的精度为0.935,召回率为0.952,F1分数为0.943,均显著高于U-Net网络模型.DeepLab-V3+网络在点状锈蚀区域连通与分割方面优于U-Net网络,并实现了片状锈蚀区域分割,为桥梁锈蚀精准识别与分割提供了技术支撑.  相似文献   

3.
基于半监督K-means的K值全局寻优算法   总被引:3,自引:0,他引:3  
提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.  相似文献   

4.
网页分类器设计的核心是对原始分类数据集进行分类规则挖掘,本文提出了一种结合链接结构聚类的混沌粒子群网页分类规则获取算法.算法将聚类和分类结合起来进行分类规则提取:首先用基于K均值的聚类算法对一部分有代表性的链接结构数据聚类,进行类别自动标注,形成训练集;再用混沌粒子群算法对已标注类别的数据提取分类规则.实验结果表明,这种模式充分发挥了基于链接的分类方法受人为因素干扰最小的优点,减少了人工标注类别的工作量,同时提高分类的准确率和效率.  相似文献   

5.
大间隔分布学习机(LDM)在应用于不平衡据分类时,由于忽略类别不均衡,会使少数类样本的识别率较低。针对这一不足,结合代价敏感思想提出了一种不平衡代价敏感大间隔分布算法(ICS-LDM)。首先,在计算间隔均值和间隔方差时,结合数据集的不平衡因子和样本错分代价参数,调整不同类别的间隔分布权重;其次,将可以快速收敛的循环对偶坐标下降法应用于求解目标函数;最后,通过逐渐提高少数类的间隔分布,可以实现间隔分布在各类别平衡且总体最大。在虚拟数据集和UCI公开数据集上的实验结果表明,ICS-LDM可以有效提高少数类的分类精度,平衡各类的分类性能。  相似文献   

6.
传统基于概率分布的不完整数据聚类填充算法,未综合分析数据对象的类别属性,数据填充效率和精度较低。因此,本文提出一种新的聚类填充算法,利用近邻传播(AP)算法聚类不完整数据,采用元祖相似度算法对不同类别的不完整数据实施填充。通过数据挖掘方法获取多类别不完整云计算网络系统中的加权关联规则,实施常规缺失数据的填充,采用数据推荐筛选方案实施元组相似度运算,完成异常缺失数据的填充,最终获取完整的云计算网络数据集,提高云计算网络数据的有效利用率。实验表明,本文设计的聚类填充算法具有较高的填充效率和精度。  相似文献   

7.
针对入侵检测中少数类异常数据的检测精度较低的问题,提出基于支持向量聚类的不平衡数据无监督检测算法.方法采用支持向量聚类对所有未知样本进行聚类,根据不同类别样本内在属性的差异,用改进的重抽样方法选择样本,平衡数据集的分布,对新的数据集进行学习.经过KDD99的测试表明,该方法能有效检测出少数类样本.  相似文献   

8.
提出了基于分布式聚类的异常入侵检测方法ID—DC,通过对训练集进行分布式聚类产生聚簇模型,采用基于双参考点的标识算法Double—Reference标记异常簇,不需要具有类别标签的训练集且可自动确定聚簇模型的个数.实验中采用了网络入侵检测数据集KDD—CUP-99来训练模型.实验结果表明:通过采用分布式聚类算法建立的分布式入侵检测模型可有效地检测攻击,检测率高,误警率低.  相似文献   

9.
为克服k-means算法难以探测出一些局部分布稀疏不均、聚类区域的形状与大小不规整数据点集的聚类分布结构这个缺点,在半监督学习思想的指导下,针对混合属性空间区域中具有同一分布性质的带有类别标记的小样本数据集和无类别标记的大样本数据集,提出了一种基于半监督学习的k平均聚类框架。仿真实验表明:该框架经常能取得比k-means更好的聚类精度,从而说明这个半监督学习框架具有一定的有效性。  相似文献   

10.
现实世界中的数据挖掘经常涉及从类别分布不平衡的数据集学习,少数类的数量相比于其他类较少.从包含少数类的数据集中学习,通常会产生偏向于多数类的预测分类器,但对少数类的预测精度较差.针对少数类学习提出一种新的集成算法Cost-SMOTEBoost,该算法是SMOTE算法和AdaCost算法的结合.通过实验表明,Cost-SMOTEBoost算法在不降低精确率的情况下提高了召回率,从而提高了在分布不平衡数据集上的表现.  相似文献   

11.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

12.
用改进的RPCL算法提取聚类的最佳数目   总被引:6,自引:0,他引:6  
对于传统的K 平均算法来说,如何选择适当类的数目是一个难以解决的问题.有人提出了次胜者受罚的竞争学习(rivalpenalized com petitive learning : RPCL)算法试图来解决这一问题.但是,当数据类有重叠以及输入矢量含有非独立项时,RPCL算法的性能不能令人满意.本文提出了一种结合全协方差矩阵的RPCL算法,并逐步删除那些只包含少量训练数据的类.这种算法,我们称之为改进的RPCL算法.我们用改进的RPCL算法来确定高斯混合分布类的数目,并将其与原来的RPCL进行比较.实验证明,改进的RPCL算法比原来的RPCL算法能够更好地表征类  相似文献   

13.
通过分析K2,BIC,AIC和IM等方式的原理,改进K2算法,在不考虑先验知识的基础上,创建了新的基于隐式网络的打分函数取代了原有算法的评分规则,实现贝叶斯网络结构学习.仿真实验结果表明,针对标准数据集学习,隐式法的贝叶斯网络学习算法在没有先验知识的条件下和依赖先验知识的基于BDe评分的K2算法相比收敛速度和准确率有一...  相似文献   

14.
提出了一种新的聚类算法PMM,使用概率分析和密度直方图法确定密度阈值,应用多密度阈值对数据空间进行滤波以消除不相关数据的干扰,使用数学形态学理论发现聚类簇,提高了聚类的准确性,按照聚类的特点实现了相关形态学操作的快速算法,提高了运算效率.实验表明PMM的计算复杂度与数据量呈线性关系,能够发现任意形状的聚类簇,对噪声不敏感,并能区分密度不同的聚类簇.  相似文献   

15.
在联合作战体系中,数据作为基础性战略资源发挥着重要的底层支撑作用,数据妥善管理和高效利用是推动作战能力整体跃迁和作战样式深度变革的重要动力。为实现不同作战系统间信息的互联互通,提出 一种基于联邦学习的多源异构网络无数据融合方法。从多源数据融合面临的安全性和异构性问题出发,利用条件生成对抗网络提取本地知识和全局分布,集成数据信息;结合局部教师模型-全局模型架构,以无数据知识蒸馏的方式对局部模型知识进行迁移,融合异构网络,细化全局模型,实现不同系统间安全、高质量的信息交互,为智能化指挥信息系统建设提供技术支撑。实验结果表明:该方法在结构化数据和图像数据上具有可行性,整体准确率可达到80%以上。  相似文献   

16.
针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进行实验,实验结果表明,该改进算法能够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现.  相似文献   

17.
基于神经网络的机器人运动模型辨识及实验验证   总被引:1,自引:1,他引:1  
为提高机器人模型辨识时神经网络的学习速度,改进得到一种新的神经网络拓扑结构——状态延迟输入动态递归神经网络.以德国PowerCubeTM模块化机器人为研究对象,将机器人关节位置信息和OPTOTRAK 3020三维运动测量系统测得的机器人末端位置信息作为神经网络的学习样本,对包含各种影响因素的机器人运动模型进行了辨识.并以此模型为基础,输入验证样本进行验证,所得结果及误差分析说明了该神经网络在学习能力上的优越性及辨识模型的有效性.  相似文献   

18.
研究了Rough集和神经网络方法在信息融合目标识别中的应用 .提出将神经网络学习机制引入到Rough集系统 ,同时通过Rough集的条件和决策属性构造神经网络结构 ,并针对三种不同谱段下的三种不同目标图像进行了实验 ,试验表明 ,Rough集 神经网络相结合的识别算法的识别率要明显高于单独使用一种融合算法的识别率 ,训练时间也大大缩短 .  相似文献   

19.
为了解决文本图神经网络小样本文本分类精度较差的问题,设计了基于文本图神经网络的原型网络,采用预训练语言模型,利用文本级图神经网络为每个输入文本构建图并共享全局参数,将文本图神经网络的结果作为原型网络的输入,对未标注文本进行分类,并验证新模型在多个文本分类数据集上的有效性。实验结果表明,与需要大量标注文档的监督学习方法相比,所采用的方法未标注文本的分类精度提高了1%~3%,在多个文本分类数据集上验证了新模型性能先进,内存占用更少。研究结果可为解决小样本文本分类问题提供参考。  相似文献   

20.
给出一种将网格技术、密度技术与分形理论的自相似性结合起来的一种有效聚类算法,利用分形维度变化最小同时是相似程度最大的特点来划分数据集从而得出聚类结果.实验表明该算法可以快速有效的处理多维大型数据集,识别出任意形状簇的个数,而且可以从数据集中挖掘出一些有用的分布信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号