共查询到18条相似文献,搜索用时 46 毫秒
1.
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法-基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise, QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。 相似文献
2.
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 相似文献
3.
离群数据挖掘是数据挖掘研究的重要内容,在实际生活中获得广泛应用.论文结合了免疫算法全局搜索的优点和K-均值方法局部收敛速度快的特点,提出了一种基于免疫聚类算法的离群数据挖掘方法,有效地克服了传统聚类方法对初始化敏感、容易陷入局部最优等缺点,使聚类结果能够快速收敛到全局最优,有效地检测离群数据.实验结果表明,该方法实用有效的. 相似文献
4.
为提高自组织网络的聚类能力,提出一种基于Bloch球面旋转的量子自组织网络聚类算法.通过使样本数据作为量子比特相位,将样本映射为Bloch球面上的量子比特,将竞争层权值映射为Bloch球面上随机分布的量子比特;通过计算样本和权值的球面距离最小值,确定获胜节点;通过使获胜节点及其邻域节点在Bloch球面上向着样本旋转来调整这些权值,直到算法收敛.该方法的明显优势在于有较高的聚类精度.以鸢尾属植物样本聚类为例,实验结果表明,提出的方法明显优于传统自组织网络、K-均值聚类等算法. 相似文献
5.
现有入侵检测研究多集中在网络和操作系统,而数据库系统具有自己的结构和语义,针对数据库特点的入侵检测是现有数据库安全机制的重要补充。提出一种数据库异常检测算法,该算法对数据库查询进行密度聚类,并通过聚类的核心对象来建立正常轮廓。说明了该算法的训练、检测、增量更新方法和查询执行前检测算法,并通过实验和实例对算法的性能和应用做了分析。 相似文献
6.
一种基于自组织特征映射网络的聚类方法 总被引:7,自引:0,他引:7
针对传统聚类算法不能有效地处理大数据集和高维数据集的问题,提出了一种基于自组织特征映射网络的聚类方法。该方法能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变,而且无需监督,能自动对输入模式进行聚类。给出了应用该方法的具体步骤和加速自组织过程的若干改进方法,通过仿真实验证明该算法的有效性。 相似文献
7.
本文在粒度空间理论的基础上,进行了基于粒度空间的最优聚类模型研究.具体包含以下三个内容:首先提出了基于类内偏差和类间偏差获取数据分层结构的优化聚类指标,进一步建立最优聚类模型,证明了该模型解的存在性,并给出了相应的算法;其次将发生在1902-2015年间同时含有HA与NA蛋白的甲型H1N1流感病毒序列作为实验数据库,应用本文提出的优化模型和算法构建了流感病毒蛋白系统的第一级结构和第二级结构,基于距离中心最近原理建立了签名病毒选取的优化模型,挑选签名病毒蛋白,并构建H1N1流感病毒的核心进化树;最后基于距离中心最近原则构建分类器以验证本文方法的有效性.实验结果表明:应用本文方法处理甲型H1N1流感病毒可得到非常好的分类结果,且正确率达到93.25%.这些为基于大数据的信息处理提供一整套全新的处理方法. 相似文献
8.
针对基于安全多方计算聚类算法的低效问题,提出了基于聚类特征树结构的隐私保护的层次k-means聚类算法.算法基于半诚信模型,在第三方内存中保留对各记录的索引信息及聚类特征树的当前层信息,减少了I/O次数和通信量,克服了难以适应多数据方和因过于信赖第三方导致隐私泄漏等缺陷.算法通过基于安全多方计算的标准化协议、距离计算协议和聚类中心计算协议,实现了数据的有效保护,综合层次和k-means聚类算法的优点,提高了计算精度和算法的可伸缩性.理论证明了算法的安全性和高效性,实验结果表明所提算法优于同类算法. 相似文献
9.
一种基于网格密度与空间划分树的聚类算法 总被引:1,自引:0,他引:1
基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSFF算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点. 相似文献
10.
11.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。 相似文献
12.
基于AIC准则的最近邻聚类模型的优化算法 总被引:2,自引:0,他引:2
秦宣云 《系统工程与电子技术》2005,27(2):257-259
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。 相似文献
13.
多故障作为标准单故障的组合, 很多文献对多故障的诊断都提出行之有效的解决策略, 但却忽视单故障模式之间的相互关系, 而影响到多故障诊断效率, 尤其对于故障繁多的复杂产品. 为了克服该缺点, 引入KFCM-F算法和核化聚类有效性指标KVK, 提出两阶段聚类框架, 数据仿真试验证明该框架能有效发现单故障之间的潜在关系, 从而达到压缩故障模式以期提高诊断效率的目的. 相似文献
14.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的. 相似文献
15.
一种基于区间数多指标信息的FCM聚类算法 总被引:8,自引:0,他引:8
针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzy c-means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理.然后根据提出的两个定理,进一步给出了基于区间数信息的FCM聚类算法的迭代步骤.最后,通过一个算例说明了给出的聚类算法. 相似文献
16.
改进的基于矢量空间的群体聚类算法 总被引:1,自引:0,他引:1
针对群体聚类算法中,一般以群体成员偏好矢量的相似度作为相聚依据,但这类方法通常不能保证群体聚类后聚集的一致性的问题。提出了成员与成员集的相似度概念,给出了基于聚集一致性的成员与聚集相聚的条件,描述了一个改进的群体聚类启发式算法。同时,还定义了群体及聚集一致性的偏差指标和相对偏差指标,用以评估聚类结果。实例测试表明,该算法有较好的聚类性能和较低的一致性偏差指标。 相似文献
17.
为了对时间序列数据进行聚类分析, 提出了一种基于独立成分分析的时间序列多路归一化割谱聚类方法, 并给出了利用独立成分分析对时间序列数据进行特征提取和降维的理论解释. 该方法首先利用独立成分分析对时间序列数据进行特征提取, 然后利用多路归一化割谱聚类方法完成对时间序列特征数据的聚类分析, 从而得到了一种新的基于特征的时间序列聚类方法. 为了验证该方法的可行性和有效性, 将其应用于仿真时间序列数据和实际的股票时间序列数据聚类分析中, 取得了较好的数值结果. 相似文献
18.
目前对全球导航卫星系统(global navigation satellite system, GNSS)三频组合观测值优选的研究,主要集中在全球定位系统(global positioning system, GPS)和北斗二号(beidou navigation satellite system, BDS-2)上,对BDS-3的研究相对较少。为克服以往聚类优选算法中存在的仅适用于类球形簇、聚类数目和初始聚类中心的确定主观性强、对离群点敏感、易陷于局部最优等不足,提出一种改进的核模糊C均值聚类算法,引入核函数与抑制离群点的新距离度量,基于多类广义核极化准则优化核参数,用改进爬山法确定聚类数目与初始聚类中心。然后,以模糊C均值聚类算法为对照进行了对比实验,在短、长两种基线下分别解算组合模糊度。通过对优选所得代表性组合的模糊度固定成功率进行对比分析,验证了该算法的可行性与算法改进的有效性。 相似文献