共查询到20条相似文献,搜索用时 15 毫秒
1.
基于模糊聚类的异类多传感器数据关联算法 总被引:4,自引:0,他引:4
针对异类传感器观测空间不一致的问题,提出了基于模糊聚类的异类多传感器数据关联算法.该算法首先通过在不同传感器的观测空间上建立多目标运动状态的投影,将多传感器多目标关联问题分解为多个单传感器多目标的关联问题,再对单传感器采用模糊聚类的方法求解关联概率,实现了在密集杂波环境中多目标的数据关联和精确跟踪.该算法降低了多传感器多目标跟踪的复杂性和计算量,有效地解决了异类多传感器可用公共信息少的问题.仿真结果表明,该算法的跟踪误差要小于传统的联合概率数据关联算法,且具有更优越的跟踪性能. 相似文献
2.
一种基于灰色聚类和模糊聚类的集成方法 总被引:2,自引:0,他引:2
根据灰色聚类,模糊聚类,关联系数原理,提出一种新的综合集成方法,利用灰色关联系数将灰色聚类与模糊聚类集成,使聚类结果不仅反映了各聚类对象所属灰类的信息,还有效显化了各个对象间的相互关系的信息. 相似文献
3.
基于集成学习的思想,提出一种分布式聚类模型.该模型的分布式处理过程分为2个阶段:先在局部站点局部聚类,然后在全局站点全局聚类.局部站点的局部聚类看作是一种基于数据子集的学习过程,所有的局部聚类结果组成了聚类集成系统的个体学习器,全局聚类采用平均法对局部结果进行集成,并定义了一个准则函数来度量集成的精度.把K-means算法推广到分布式环境,提出一种基于该模型的分布式K均值算法DK-means,该算法对局部数据的分布有较强的伸缩性.实验结果表明,DK-means在同等条件下能达到集中式聚类的精度水平,是有效可行的,从而验证了基于集成学习的分布式聚类模型的有效性. 相似文献
4.
传统的分类算法大多假设数据集是均衡的,追求整体的分类精度.而实际数据集经常是不均衡的,因此传统的分类算法在处理实际数据集时容易导致少数类样本有较高的分类错误率.现有针对不均衡数据集改进的分类方法主要有两类:一类是进行数据层面的改进,用过采样或欠采样的方法增加少数类数据或减少多数类数据;另一个是进行算法层面的改进.本文在原有的基于聚类的欠采样方法和集成学习方法的基础上,采用两种方法相结合的思想,对不均衡数据进行分类.即先在数据处理阶段采用基于聚类的欠采样方法形成均衡数据集,然后用AdaBoost集成算法对新的数据集进行分类训练,并在算法集成过程中引用权重来区分少数类数据和多数类数据对计算集成学习错误率的贡献,进而使算法更关注少数数据类,提高少数类数据的分类精度. 相似文献
5.
6.
针对现有的集成聚类算法通常默认使用K-means算法作为基聚类生成器,虽能确保聚类成员的多样性,却忽视了差的基聚类可能会对最终聚类结果造成极大干扰的问题,提出一种基于聚类质量的两阶段集成算法.鉴于K-means算法运行高效但聚类质量较粗糙,提出首先在生成阶段采用K-means算法生成基聚类成员,然后通过群体一致性度量筛选出兼具高质量和强多样性的聚类成员,形成候选集成;其次,进一步在集成阶段应用信息熵知识构建基聚类加权的共协矩阵;最后应用一致函数得到最终聚类结果.采用3个指标在10个真实数据集上进行对比实验,实验结果表明,该算法在有效提升聚类结果准确度的同时,能保持较好的鲁棒性. 相似文献
7.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度. 相似文献
8.
一种基于关联规则的搜索引擎结果聚类算法 总被引:4,自引:0,他引:4
提出一种搜索引擎结果的聚类方法,采用关联规则方法确定网页文档中的显著短语,并把这些显著短语作为对相应聚类的描述,聚类中包含的文档就是显著短语所关联的文档,然后对形成的聚类按照相关度分数进行排队,最终把结果展现给用户. 相似文献
9.
介绍了关联规则挖掘的研究情况,提出了基于聚类的周期关联规则挖掘算法,分析了该算法存在的问题并提出解决方案,展望了关联规则挖掘的未来研究方向. 相似文献
10.
聚类集成的目的是通过集成多个不同的基聚类来生成一个更好的聚类结果,近年来研究者已经提出多个聚类集成算法,但是目前仍存在的局限性是这些算法大多把每个基聚类和每个簇都视为同等重要,使聚类结果很容易受到低质量基聚类和簇的影响.为解决这个问题,研究者提出一些给基聚类加权的方法,但大多把基聚类看作一个整体而忽视其中每个簇的差异.... 相似文献
11.
针对目前基于K-Means算法的入侵检测技术所存在的符号类型数据处理能力欠缺、误报率较高的问题,提出了一种基于聚类和关联规则修正的入侵检测技术。将关联规则挖掘技术引入到聚类分析机制中,利用针对符号型属性的关联规则挖掘结果对聚类结果进行修正,从而有效降低由于在入侵检测单纯使用聚类分析所导致的误报。详细阐述了改进的具体实现方案,并通过实验验证了该技术的可行性。 相似文献
12.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较. 相似文献
13.
科技查新用户数据是查新业务积累的真实而宝贵的资源,其充分利用不仅是查新业务管理的需要,可提升查新服务水平,同时还能用于挖掘更多的情报价值.调研发现,当前对科技查新用户数据的挖掘利用仍以基础性的业务管理分析为主,而增值情报价值的挖掘较少.为拓展成都文献情报中心科技查新客户群体和增值服务范围,做大做强查新业务,立足成都中心查新服务实践,依托于积累查新用户及其服务记录,在挖掘发现潜在服务对象的基础上,通过多维用户关联聚类,探讨了后期信息情报服务的精准营销与推送,分析了基于用户聚类的服务推荐存在的不足,展望了挖掘更多需求信息的推荐路径. 相似文献
14.
针对粗糙集无法对航空电子装备测试数据中的连续数据进行处理的问题,提出一种基于FCM聚类的离散化方法,通过计算各聚类中心值进行离散化处理,并应用粗糙集属性约简和规则提取方法,获得最终诊断规则,并在某型机载电台故障诊断中验证其有效性。 相似文献
15.
16.
一种基于层次聚类的流数据挖掘方法 总被引:1,自引:0,他引:1
单劲松 《太原师范学院学报(自然科学版)》2008,7(4):72-74
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法. 相似文献
17.
针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进行实验,实验结果表明,该改进算法能够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现. 相似文献
18.
19.
一种基于聚类树的增量式数据清洗算法 总被引:2,自引:0,他引:2
研究了在数据模式与匹配规则不变的前提下 ,数据集动态增加时近似重复记录的识别问题 ,提出了一种基于聚类树的增量式数据清洗算法IACT .该算法通过构建聚类树先对记录进行分区 ,然后在划分的区域内进行相似度的计算识别出近似重复记录 ,从而完成了增量式相似重复记录的检测 .实验结果证明了IACT算法在无损精度的情况下 ,在效率上优于多趟邻近排序 (MPN)算法 . 相似文献
20.
介绍了关联规则挖掘的研究情况,提出了基于聚类的周期关联规则挖掘算法,分析了该算法存在的问题并提出解决方案,展望了关联规则挖掘的未来研究方向. 相似文献