共查询到18条相似文献,搜索用时 46 毫秒
1.
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法-基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise, QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。 相似文献
2.
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tri-training算法及其改进算法,DPC-TT算法具有更好的分类性能。 相似文献
3.
离群数据挖掘是数据挖掘研究的重要内容,在实际生活中获得广泛应用.论文结合了免疫算法全局搜索的优点和K-均值方法局部收敛速度快的特点,提出了一种基于免疫聚类算法的离群数据挖掘方法,有效地克服了传统聚类方法对初始化敏感、容易陷入局部最优等缺点,使聚类结果能够快速收敛到全局最优,有效地检测离群数据.实验结果表明,该方法实用有效的. 相似文献
4.
为提高自组织网络的聚类能力,提出一种基于Bloch球面旋转的量子自组织网络聚类算法.通过使样本数据作为量子比特相位,将样本映射为Bloch球面上的量子比特,将竞争层权值映射为Bloch球面上随机分布的量子比特;通过计算样本和权值的球面距离最小值,确定获胜节点;通过使获胜节点及其邻域节点在Bloch球面上向着样本旋转来调整这些权值,直到算法收敛.该方法的明显优势在于有较高的聚类精度.以鸢尾属植物样本聚类为例,实验结果表明,提出的方法明显优于传统自组织网络、K-均值聚类等算法. 相似文献
5.
一种基于自组织特征映射网络的聚类方法 总被引:7,自引:0,他引:7
针对传统聚类算法不能有效地处理大数据集和高维数据集的问题,提出了一种基于自组织特征映射网络的聚类方法。该方法能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变,而且无需监督,能自动对输入模式进行聚类。给出了应用该方法的具体步骤和加速自组织过程的若干改进方法,通过仿真实验证明该算法的有效性。 相似文献
6.
本文在粒度空间理论的基础上,进行了基于粒度空间的最优聚类模型研究.具体包含以下三个内容:首先提出了基于类内偏差和类间偏差获取数据分层结构的优化聚类指标,进一步建立最优聚类模型,证明了该模型解的存在性,并给出了相应的算法;其次将发生在1902-2015年间同时含有HA与NA蛋白的甲型H1N1流感病毒序列作为实验数据库,应用本文提出的优化模型和算法构建了流感病毒蛋白系统的第一级结构和第二级结构,基于距离中心最近原理建立了签名病毒选取的优化模型,挑选签名病毒蛋白,并构建H1N1流感病毒的核心进化树;最后基于距离中心最近原则构建分类器以验证本文方法的有效性.实验结果表明:应用本文方法处理甲型H1N1流感病毒可得到非常好的分类结果,且正确率达到93.25%.这些为基于大数据的信息处理提供一整套全新的处理方法. 相似文献
7.
现有入侵检测研究多集中在网络和操作系统,而数据库系统具有自己的结构和语义,针对数据库特点的入侵检测是现有数据库安全机制的重要补充。提出一种数据库异常检测算法,该算法对数据库查询进行密度聚类,并通过聚类的核心对象来建立正常轮廓。说明了该算法的训练、检测、增量更新方法和查询执行前检测算法,并通过实验和实例对算法的性能和应用做了分析。 相似文献
8.
针对基于安全多方计算聚类算法的低效问题,提出了基于聚类特征树结构的隐私保护的层次k-means聚类算法.算法基于半诚信模型,在第三方内存中保留对各记录的索引信息及聚类特征树的当前层信息,减少了I/O次数和通信量,克服了难以适应多数据方和因过于信赖第三方导致隐私泄漏等缺陷.算法通过基于安全多方计算的标准化协议、距离计算协议和聚类中心计算协议,实现了数据的有效保护,综合层次和k-means聚类算法的优点,提高了计算精度和算法的可伸缩性.理论证明了算法的安全性和高效性,实验结果表明所提算法优于同类算法. 相似文献
9.
一种基于网格密度与空间划分树的聚类算法 总被引:1,自引:0,他引:1
基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSFF算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点. 相似文献
10.
11.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。 相似文献
12.
13.
14.
Lǖ Zonglei 《系统工程与电子技术(英文版)》2009,20(5):1132-1143
A new incremental clustering framework is presented, the basis of which is the induction as inverted deduction. Induction is inherently risky because it is not truth-preserving. If the clustering is considered as an induction process, the key to build a valid clustering is to minimize the risk of clustering. From the viewpoint of modal logic, the clustering can be described as Kripke frames and Kripke models which are reflexive and symmetric. Based on the theory of modal logic, its properties can be described by system B in syntax. Thus, the risk of clustering can be calculated by the deduction relation of system B and proximity induction theorem described. Since the new proposed framework imposes no additional restrictive conditions of clustering algorithm, it is therefore a universal framework. An incremental clustering algorithm can be easily constructed by this framework from any given nonincremental clustering algorithm. The experiments show that the lower the a priori risk is, the more effective this framework is. It can be demonstrated that this framework is generally valid. 相似文献
15.
16.
针对经典算法LEACH和HEED的不足,提出了一种能自适应分簇组网的优化算法。构建了节点信息权重模型,并借鉴邻节点信息交换的思想,在成簇过程中与探测范围内的节点交换权重信息,自适应完成分布式网络的簇首选举,并根据最小距离原则成簇。理论分析和仿真实验表明,该算法比LEACH和HEED算法选取的簇首及形成的簇结构更加合理,同时更有效地降低与均衡了网络的能耗,提高了传感器网络的生命周期。Abstract: A self-adaptive and optimized clustering algorithm was put forward according to the shortage of LEACH and HEED. The Heavy-weight model about nodes' messages was created,and the idea that neighbor nodes exchanged messages each other was used for reference. The nodes which were able to communicate with each other exchanged the Heavy-weight during making clusters,elect self-adaptively the cluster head in distributing networks,and made some clusters based on the minimum distance principle. The theoretic analysis and simulation results prove that the elected cluster head and cluster structure are more reasonable,the energy expenditure in networks is less,the longevity of networks is longer by the optimized algorithm compared to LEACH and HEED. 相似文献
17.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的. 相似文献
18.
基于AIC准则的最近邻聚类模型的优化算法 总被引:2,自引:0,他引:2
秦宣云 《系统工程与电子技术》2005,27(2):257-259
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。 相似文献