首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
空间数据库中存储了海量的实时数据,常规的算法在数据挖掘过程中无法根据空间数据流的特征进行聚类.针对该问题,我们提出一种基于网格和距离阈值的空间数据流聚类算法,该算法分为离线和在线部分,为实时数据赋予时间相关的距离值,利用网格进行聚类.实验证明此算法对于空间数据流聚类具有理想的结果.  相似文献   

2.
分形集维数的一种推广   总被引:1,自引:0,他引:1  
本文推广分形集维数的概念,提出了维数型的概念,并证明了对任意一种维数型,都存在这种型的分形。  相似文献   

3.
一种基于可变滑动窗口的数据流分段聚类算法   总被引:2,自引:2,他引:0  
数据流的应用越来越广泛,数据流挖掘成为数据挖掘的重点研究方向之一。在分析各种数据流聚类算法的基础上,提出了一种基于可变滑动窗口的数据流分段聚类算法。算法以时间序列数据流模式表示技术为参考,以去除噪音和压缩数据为目的,实现了数据流的特征提取和概要存储。实验表明,算法具有低时空复杂度、自适应等特点。  相似文献   

4.
一种基于密度和网格的高效聚类算法   总被引:1,自引:0,他引:1  
聚类已成为数据挖掘的主要方法之一,能够帮助人们在大量的数据中发现隐藏信息.目前最具典型的密度聚类算法是DBSCAN(density-based spatial clustering of applications with noise),它能够在空间数据库中很好地发现任意形状的簇并有效地处理噪声,但是它的计算复杂度相对较大.因此,采用划分数据集和聚簇合并方法,提出了一种基于密度和网格的高效聚类算法DGCA,并通过人工合成数据集和真实数据集对该聚类算法进行理论验证.实验结果表明该算法在效率性能和质量方面比DBSCAN都得到了提高.  相似文献   

5.
一种基于网格的层次聚类算法   总被引:1,自引:0,他引:1  
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.  相似文献   

6.
数据流潜在无限、流动迅速、变化频繁等特点,使在数据流上实现隐私保护面临重大挑战.在阐述数据流匿名的概念及分析现有数据流匿名算法特点的基础上,提出基于聚类的数据流匿名设计思想,并给出算法实现.在真实数据集上的实验结果表明,新算法在满足匿名要求的同时能够降低概化和抑制处理带来的信息损失.  相似文献   

7.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

8.
为了提高数据流的聚类质量与效率,提出了一种基于密度的数据流聚类算法,该算法采用双层聚类框架,对于历史数据的遗忘问题采用了消逝策略和粒度调整策略,消逝策略能够处理噪声,节约内存;粒度调整策略检测当前的内存消耗,提高了聚类质量。基于标准数据集和仿真数据集的实验表明,此算法是可行有效的,适合处理和分析大规模的快速数据流。  相似文献   

9.
给出一种将网格技术、密度技术与分形理论的自相似性结合起来的一种有效聚类算法,利用分形维度变化最小同时是相似程度最大的特点来划分数据集从而得出聚类结果.实验表明该算法可以快速有效的处理多维大型数据集,识别出任意形状簇的个数,而且可以从数据集中挖掘出一些有用的分布信息.  相似文献   

10.
一种计算图像分形维数的有效方法   总被引:3,自引:0,他引:3  
分形维数是一个很有价值的特征,可用来描述粗糙的、具有自相似特征的图像.这些特征已经被用在纹理分割、图像压缩、形状分析以及其他方面.文中提出了一种有效的局部盒维数的计算方法,并用它来提取图像的局部分形特征.用人造图像和自然纹理图像做实验,把它与其他5种计算分形维数的方法比较,结果显示该方法既精确又有效.  相似文献   

11.
为了发现分布式数据流环境下的微簇,针对数据流的遗忘特性,提出一种基于时间衰减的数据流聚类算法.根据衰减模型增量式的处理局部站点,将局部模型发送给中心站点.中心站点对局部站点的微簇进行合并,生成全局聚类模型.通过真实数据和仿真数据的实验表明,该算法能够得到较好的聚类质量,并且有较好的伸缩性.  相似文献   

12.
介绍了科学管理流数据的流数据管理系统及根据BIRCH算法中聚类特征的概念,利用簇特征设计与实现了一种新的动态流数据聚类算法。这种新算法改善了基于滑动窗口流数据聚类的有效性以及空间和时间复杂度问题。理论分析和实验结果证明该算法能够有效地处理滑动窗口流数据集,使聚类算法具有良好的可扩展性。  相似文献   

13.
基于分形维数的火焰特征提取方法   总被引:1,自引:0,他引:1  
本文运用分形维数可以表示曲线的复杂程度的特性来提取图像轮廓特征,它具有计算简单、物理意义明确、抗干扰能力强的特点。实验证明该方法计算简单,处理速度快,为进一步进行火焰图像的识别奠定了基础。  相似文献   

14.
针对交通数据流聚类分析过程中生成顺序的不确定性,提出了采用基于网格和密度的D-Stream算法对交通数据流进行聚类分析,并将粒子群优化算法引入聚类过程,从而对数据流聚类分析方法进行了改进,使数据聚类能够根据本身的密度极大值有序生成,增强了用户对聚类过程的控制能力.通过昆明市实测交通数据流进行聚类分析,得到了能够反映交通状况不同特征的聚类结果和动态的控制策略,并对交通数据流的相关研究工作提供决策支持.  相似文献   

15.
16.
一种基于分形维的快速属性选择算法   总被引:9,自引:0,他引:9  
属性选择是数据挖掘、文档分类和多媒体索引等领域研究的一个热点问题·利用分形维进行属性选择是一种新的方法,它利用数据集的分形维作为属性的重要性度量·基于分形维的快速属性选择算法(IFAS),利用后向属性选择策略和降维操作的投影特性,根据E维的分形树导出E 1维的分形树(用来计算分形维的数据结构)·因此,只需扫描一次数据集,避免了FDR算法多次扫描数据集的问题·通过图像特征数据集合和合成的分形数据集对两种算法进行性能测试·实验结果显示,IFAS算法明显优于FDR算法·IFAS算法的时间和空间复杂度都为O(n),响应时间与属性维数呈线性关系·  相似文献   

17.
提出一种基于分形维数的图像自适应水印算法.采用盒子维方法提取图像的分形维数,依据分形维对图像分块.结合HVS的纹理掩蔽特性,对不同分块采用不同水印嵌入系数,多参数、自适应地嵌入水印.  相似文献   

18.
罗静  刘宗歧 《科技信息》2011,(13):366-367
本文阐述了数据挖据的一些主要的方法和技术,详细介绍了基于网格的聚类技术,采用foodmart数据库作为算法输入的数据集,应用基于网格距离的聚类算法的实现对电力营销中客户的购买行为进行了聚类和预测,并验证了算法的正确性和有效性。  相似文献   

19.
针对目前流聚类算法无法有效处理数据流离群点的检测和处理,以及增量式数据流聚类效率较低等问题,提出了一种基于密度度量的异常检测、删除的增强型仿射传播流聚类算法。在仿射传播流聚类算法的基础上,所提算法通过引进异常检测和删除机制改善了异常点对聚类精度、聚类效率的影响。利用仿射传播聚类实现在线数据流的聚类过程,同时检测数据漂移现象,即数据流分布特征随时间发生变化,并采用基于密度度量的局部异常因子检测技术(LOF)对储备池数据进行异常检测和删除处理,通过对当前类簇和处理过的储备池数据重聚类来重建动态数据流模型。在真实网络数据(KDD’99)上进行了实验,结果表明,所提算法不仅减少了重聚类构建动态模型的次数,改善了聚类效率,而且在同时考虑聚类精度、纯度和熵3种聚类评价标准下,均优于传统的仿射传播流聚类算法。  相似文献   

20.
针对无人机(Unmanned Aerial Vehicle,UAV)辅助非正交多址(Non-Orthogonal Multiple Access,NOMA)下行通信系统,提出了最大化和速率的用户动态分簇与功率分配方案.考虑用户服务质量与UAV位置约束,建立了和速率最大化的优化问题.由于目标函数的非凸性,将原问题解耦为三个子问题,分别优化UAV位置部署与用户连接、用户动态分簇、功率分配以提高系统性能.首先,基于K-means算法设计了UAV位置部署与用户连接方案,以减小路损为目的确定UAV最佳部署位置,同时选择其服务的最优用户群;其次,改进多密度流聚类(Multi-Density Stream Clustering, MDSC)算法,提出了单UAV下用户静态与动态分簇方案,静态分簇方案可自适应平衡簇数与簇用户数,并获得较大的簇内用户信道增益差异,动态分簇方案则针对用户移动属性,制定了即时更新策略;最后,使用分式规划(Fractional Programming,FP)二次变换的方法,引入辅助变量将原非凸问题变换为凸问题,交替优化辅助变量与功率分配因子,获得原非凸问题的次优解.仿真结果表明,与其他算法相比,本文分簇方案能获得更大的簇内信道差异与更小的簇内用户数标准差,同时用户系统性能也获得了显著提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号