首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
当前高速网络数据流分类处理时,忽略了冗余数据对分类结果的影响,使得分类结果 F1值较低。因此,提出了基于谱聚类算法的高速网络数据流快速分类方法。采用主成分分析法对高速网络数据流进行降维处理。对所有数据流相关性特征进行选择,去除冗余特征,保留有效的特征信息。应用支持向量机算法构建网络数据流快速分类模型,结合谱聚类算法对多数类样本进行聚类,组成新的数据集并将其输入到分类模型中得出相关的分类结果。实验结果表明,所提方法的平均F1值为0.95,F1值越大分类结果越准确,说明该方法能够满足高速网络数据流快速准确分类,具有优越的数据分类性能,应用价值更高。  相似文献   

2.
针对网络入侵检测与聚类等问题,提出了一种综合模糊聚类与改进的SOM神经网络方法.通过对网络入侵数据提取、分析和处理,建立了网络入侵检测聚类模型,并对传统SOM网络层次进行改进,结合易发的网络入侵类型有针对性地对网络入侵数据进行聚类.网络入侵检测聚类与其他方法比较的结果表明,该模型在网络入侵检测聚类中具有更高的准确性和均衡性,该方法能有效提高网络入侵分类精度,减少聚类误差.  相似文献   

3.
利用模糊聚类方法对网络性能进行分析,解决了网络性能分析数据自动聚类分析问题.重点探讨了网络性能分析数据的数据模型的建立和聚类过程,以及根据隶属度函数确立了数据对象的隶属关系,并给出了一个具体的模糊聚类算法.  相似文献   

4.
高维数据聚类问题是当前聚类分析研究的重点。笔者提出了一种改进的基于超网络的高维数据聚类算法。首先,将高维数据映射到一个大规模带权超网络中;其次,定义超网络中边的权重;再次,采用优化的超图划分方法划分带权超网络;最后实现高维数据聚类。这样有效过滤掉聚类中的噪声数据,避免了传统聚类方法在降维过程中产生的弊端。实验证明,该算法具有较理想的有效性和精确度。  相似文献   

5.
林辉 《河南科学》2012,30(9):1243-1245
针对现有数据流聚类算法的不足,提出了改进模糊聚类算法,给数据对象的隶属度加上一个权值,以及在算法中用有效性函数来确定聚类数目C.理论分析与实验结果表明,在数据流环境下所提出的改进模糊聚类算法比传统算法有更好的聚类效果,更快的聚类速度.  相似文献   

6.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

7.
针对基于结构近似度的聚类算法无法解决非对称网络聚类的问题,该文根据社交网络的特点,提出了基于结构近似度的有向社交网络聚类算法,通过将社交网络抽象为图结构,将网络聚类问题看成图论中的子图划分问题,实现了对社交网络的准确聚类分簇,且分簇复杂度较低。使用C++语言编程实现该算法,通过自定义有向网络数据集和标准数据集的测试表明,该算法对社交网络结构的划分较为准确,且能鉴别离群节点和枢纽节点。  相似文献   

8.
为了提高数据流的聚类质量与效率,提出了一种基于密度的数据流聚类算法,该算法采用双层聚类框架,对于历史数据的遗忘问题采用了消逝策略和粒度调整策略,消逝策略能够处理噪声,节约内存;粒度调整策略检测当前的内存消耗,提高了聚类质量。基于标准数据集和仿真数据集的实验表明,此算法是可行有效的,适合处理和分析大规模的快速数据流。  相似文献   

9.
大多数的聚类算法都只是针对数值型数据,而在现实世界中,经常会遇到混合了数值属性和分类属性的数据,因此对混合数据的有效聚类是一个非常有挑战的研究问题。针对混合数据的基于熵的相似矩阵,利用阈值法构造相对应的复杂网络,对生成的复杂网络进行社团结构划分,复杂网络的一种社团结构划分就对应混合数据的一种聚类结果。通过三个实际混合数据集上的测试发现,与混合数据五种聚类算法:DP-MD-FN(density-based clustering algorithm for mixed type data employing fuzzy neighborhood)、K-Prototypes、KL-FCM-GM、EKP(evolutionary K-Prototypes)、OCIL进行比较,实验结果表明利用复杂网络社团结构划分算法得到的混合数据的聚类结果的准确性更高。  相似文献   

10.
增量聚类算法综述   总被引:2,自引:1,他引:1  
给出了增量聚类的概念,分析了增量聚类方法可以用于解决数据的变化和大量存储空间的需求问题。增量聚类算法选择恰当时,可以保证数据在变化时有效地提高聚类的精度和效率。从传统聚类、生物智能聚类和数据流聚类三个角度研究了增量聚类问题,分析了增量聚类问题的研究进展,包括发展的过程及特点,阐述了研究增量聚类问题的关键技术,最后给出了未来的发展趋势。  相似文献   

11.
采用结合模糊聚类和广义神经网络回归聚类分析的方法,对5种网络入侵行为模式进行有效的聚类.首先用模糊 c 均值聚类算法将入侵数据分为5类,再将聚类的结果中最靠近每类中心的样本作为广义神经网络的聚类训练样本进行数据训练,训练输出的结果即为该个体所属的入侵类别.实验结果表明:新算法对网络入侵途径的分类精度更高,可为预防网络入侵提供更可靠的数据支持  相似文献   

12.
一种基于可变滑动窗口的数据流分段聚类算法   总被引:2,自引:2,他引:0  
数据流的应用越来越广泛,数据流挖掘成为数据挖掘的重点研究方向之一。在分析各种数据流聚类算法的基础上,提出了一种基于可变滑动窗口的数据流分段聚类算法。算法以时间序列数据流模式表示技术为参考,以去除噪音和压缩数据为目的,实现了数据流的特征提取和概要存储。实验表明,算法具有低时空复杂度、自适应等特点。  相似文献   

13.
通过分析无线Mesh网络节点空间属性,提出了一种改进的k-medoids网络节点聚类算法.该算法基于聚类思想,将无线Mesh网络中的网关部署问题转化为空间节点数据聚类问题.构建了网络拓扑图的邻接矩阵,并利用邻接矩阵选择具有最多一跳连接节点数的对象作为初始簇中心.然后以网络跳数代替传统聚类算法中的距离参数,将最小化跳数之和作为优化目标,通过迭代方法获得稳定的聚类和分组结果.实验结果表明,离散的网络节点在空间上具有聚类特性,利用该方法可以获得更小的平均跳数和最大跳数,因此可以较好地实现网络节点分组和网关发现.  相似文献   

14.
空间数据库中存储了海量的实时数据,常规的算法在数据挖掘过程中无法根据空间数据流的特征进行聚类.针对该问题,我们提出一种基于网格和距离阈值的空间数据流聚类算法,该算法分为离线和在线部分,为实时数据赋予时间相关的距离值,利用网格进行聚类.实验证明此算法对于空间数据流聚类具有理想的结果.  相似文献   

15.
肖丹 《科技资讯》2011,(6):20-21
网络数据的采集是设计网络工具的关键技术,本文介绍了一种基于WinPcap的网络封包数据实时采集技术,该技术极大地提高了网络封包数据采集的完整性和数据存储的准确性。  相似文献   

16.
针对当前网络入侵具有多样性和易变性, 单一方法很难获得理想网络入侵检测结果的问题, 为提高网络入侵检测正确率, 有效拦截各种网络入侵, 提出一种将半监督技术与主动学习相结合的网络入侵检测方法. 首先, 采集网络入侵数据, 提取网络入侵特征, 并采用半监督技术根据特征对网络入侵数据进行聚类处理; 其次, 采用主动学习算法对聚类后的数据进行训练, 构建网络入侵检测的分类器, 并引入蚁群算法对构建网络入侵检测的分类器进行优化; 最后, 采用标准数据集对网络入侵检测方法进行仿真测试. 测试结果表明, 该方法解决了当前入侵检测方法存在的缺陷, 提升了网络入侵检测正确率, 漏检率和误检率明显少于经典网络入侵检测方法, 同时缩短了网络入侵检测时间, 改善了网络入侵检测效率, 能更好地保证网络通信和数据传输安全.  相似文献   

17.
为改进已有中文文本聚类中数据非结构化导致的算法准确度不高及特征向量高维稀疏导致算法复杂度过高的现状,提出一种基于深度词汇网络学习的中文文本聚类算法,解决了优化数据非结构化带来的聚类结果准确性低及特征向量高维度带来的高复杂度问题。首先建立词汇网络用以抽取关键义原,以词语义原代替单词作为网络节点,不仅避免了语义消歧,同时考虑到词语间语义相似性与词汇相关性,使所提取的特征向量更能表现出文章的主旨,提高聚类效果;另一方面,训练深度学习网络对特征向量降维处理,在降维的同时保留尽可能多的信息,大大减低算法的执行时间。聚类质量检测方法(F-measure)的结果表明,本文算法比k-means算法在中文文本聚类中有更好的表现。  相似文献   

18.
作为大数据的重要组成,产生于传感器、移动电话设备、社交网络等的不确定流数据因其具有流速可变、规模宏大、单遍扫描及不确定性等特点,传统聚类算法不能满足用户高效实时的查询要求.首先利用MBR(minimum bounding rectangle)描述不确定元组的分布特性,并提出一种基于期望距离的不确定数据流聚类算法,计算期望距离范围的上下界剪枝距离较远的簇以减少计算量;其次针对簇内元组的分布特征提出了簇MBR的概念,提出一种基于空间位置关系的聚类算法,根据不确定元组MBR和簇MBR的空间位置关系排除距离不确定元组较远的簇,从而提高聚类算法效率;最后在合成数据集和真实数据集进行实验,结果验证了所提出算法的有效性和高效性.  相似文献   

19.
提出了一种基于ai Net免疫网络模型的K-means聚类算法。该算法利用ai Net免疫网络模型中抗体-抗原之间的亲和力来计算聚类中心点,将数据分为若干子簇,之后再通过K-means聚类算法将这些子簇合并,得到最终的结果。该算法继承了免疫算法速度快,效率高的优点,同时也避免了K-means聚类算法容易陷入局部极小值的缺点,是一种高效的并行搜索算法。  相似文献   

20.
数据分析量巨大、逻辑关系复杂以及人工依赖程度高等因素增加了电子数据取证中行为分析的难度。针对网络入侵行为取证,提出了一种基于改进K-means聚类的机器学习分析方法。该算法改善了原有算法应用于取证所导致的缺陷问题,使初始聚类中心和聚类数能够依据向量分布情况自主进行设置,实现了网络行为智能属性归类。首先预处理网络行为数据,利用PV-DM模型将其向量化,基于改进算法寻找局部向量间相似度之和最大的向量,进而确定聚类中心与聚类数目,实现行为分类,由已知入侵行为信息关联出未知入侵用户及其行为,提升取证效率与结果完整性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号