首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
针对对海量数据库中的大数据进行优化挖掘,可以提高数据特征的提取和检测能力.传统方法采用模糊C均值聚类的数据挖掘算法,当数据在层次聚类过程中空间特征的相似度差异性较小时,数据挖掘的准确度不高.提出一种基于粒子群混沌差分训练对模糊C均值聚类算法进行改进,建立数据挖掘优化模型.首先提出了数据聚类据挖掘模型的总体构架,采用非线性时间序列分析方法进行数据信息流拟合,对数据信息流进行高阶累积量特征提取,采用粒子群混沌差分训练实现模糊C均值聚类算法改进.以改进的模糊聚类算法对提取的高阶累积量特征进行聚类分析,以分析结果为依据对数据挖掘模型进行优化.仿真结果表明,该数据挖掘模型能有效实现海量数据的优化聚类和特征提取,数据挖掘的精度较高,性能较好,避免挖掘过程陷入局部收敛.  相似文献   

2.
数据挖掘可以从海量数据中发现模型和数据间的关系并做出预测。针对入侵检测系统的特点,将数据挖掘算法应用于入侵检测系统中,并着重研究了聚类算法中的K均值算法和一种改进的K均值算法。  相似文献   

3.
Web用户聚类研究   总被引:1,自引:0,他引:1  
Web日志数据的海量增长,要求聚类算法能高效的从海量数据中得到满意的用户聚类.本文提出了一种新的聚类算法,在聚类前,利用用户兴趣度对海量数据集进行约简、减小数据计算规模,然后再对Web用户进行聚类.实验证明这种方法能减小数据规模、提高聚类效率,并得到满意的用户聚类.  相似文献   

4.
以海量非结构化数据为研究对象,在已有聚类算法研究基础上,从数据的获取与预处理,到数据聚类,再到数据的个性化管理全过程进行分析,针对数据聚类过程中的计算量庞大和复杂程度高的现状对已有CURE聚类算法进行优化,尽可能的最大程度提高数据聚类效率,进而提高大数据挖掘水平,为大数据应用提供更好的服务.通过以某通信企业不断变化的用户数据为分析对象,证明此次基于CURE聚类算法优化的数据挖掘算法有效性,结果表明CURE聚类算法优化具有一定的可用性和实用性.  相似文献   

5.
传统的聚类分析方法一般都没有考虑大容量数据集合的问题,而数据挖掘技术的研究重点之一就是如何从海量数据中高效率地获取知识。结合基于分类方法的K-means中心点算法以及基于层次方法的BIRCH增量算法提出核心树(Core-Tree)的思想来弥补两个算法的缺点,使用中心点的思想来表示BIRCH算法中汇总信息,利用类核心的思想来提高确定中心点的效率。因此,提出一种聚类算法,主要集中在如何提高大型数据集合的聚类效率、如何处理具有各种特征的数据集合。  相似文献   

6.
本文对数据挖掘中的数据流聚类算法进行分析,首先简要介绍了数据挖掘以及流数据数据挖掘的,在此基础上提出数据流聚奏算法应具备的特殊要求,并对常见的数据流聚类算法进行分析和比较。  相似文献   

7.
空间数据库中存储了海量的实时数据,常规的算法在数据挖掘过程中无法根据空间数据流的特征进行聚类.针对该问题,我们提出一种基于网格和距离阈值的空间数据流聚类算法,该算法分为离线和在线部分,为实时数据赋予时间相关的距离值,利用网格进行聚类.实验证明此算法对于空间数据流聚类具有理想的结果.  相似文献   

8.
数据挖掘技术用于在海量数据中发现有用的知识,它涉及许多领域,其中数学规划方法成为数据挖掘领域的重要工具.对《数学规划》课程教学中可以引入的分类、特征选择、聚类和回归等数据挖掘基本问题进行了讨论.  相似文献   

9.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果.  相似文献   

10.
现代信息数据的挖掘与发展   总被引:1,自引:0,他引:1  
数据挖掘作为一项从海量数据中提取知识的新技术引起学术界和产业界的极大重视。笔概括了数据挖掘的几种常见模式.如依赖模式、层次模式、序列模式等,并对这几种数据挖掘模式的特点进行了比较;阐述了从数据中提取知识的几种挖掘算法,如决策树、神经网络方法、遗传算法等;展望了数据挖掘模式和挖掘算法的发展趋势。  相似文献   

11.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识.目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足.通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型.并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性.  相似文献   

12.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识。目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足。通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型。并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性。  相似文献   

13.
Recent advances in computing, communications, digital storage technologies, and highthroughput dataacquisition technologies, make it possible to gather and store incredible volumes of data. It creates unprecedented opportunities for largescale knowledge discovery from database. Data mining is an emerging area of computational intelligence that offers new theories, techniques, and tools for processing large volumes of data, such as data analysis, decision making, etc. There are many researchers working on designing efficient data mining techniques, methods, and algorithms. Unfortunately, most data mining researchers pay much attention to technique problems for developing data mining models and methods, while little to basic issues of data mining. In this paper, we will propose a new understanding for data mining, that is, domainoriented datadriven data mining (3DM) model. Some datadriven data mining algorithms developed in our Lab are also presented to show its validity.  相似文献   

14.
提出了一种基于元学习的网络入侵协同检测框架.利用数据挖掘/分布式数据挖掘技术提取检测到新型攻击行为的模式,并实时地加入攻击特征库;利用元学习方法进行协同检测,并给了出一个改进的最佳检测模型的搜索算法,能够自动地调整分类算法的参数和系统阈值.  相似文献   

15.
关联规则挖掘寻找给定数据集中项之间的有趣关系,是数据挖掘的主要研究方面.传统的关联规则挖掘算法仅能挖掘正关联规则,事实上,负关联规则也包含了非常有价值的信息,对于决策的作用也是不容忽视的.  相似文献   

16.
一种融合蚁群算法和主成份分析的数据挖掘方法   总被引:5,自引:5,他引:0  
为帮助企业在销售资料数据库中,有效地挖掘出有用的规则,结合蚁群算法与主成分因素分析法,提出一套整合性数据挖掘方法.为了证明该方法的效能,收集了一个大型商场的销售数据,并配合其它数据挖掘软件XpertRule Miner与该方法的挖掘结果进行了分析比较.实验结果显示该方法能有效地挖掘出隐藏在数据库中的知识,进而能提供给决...  相似文献   

17.
关联规则研究综述   总被引:10,自引:0,他引:10  
关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算法,并对未来的发展趋势进行了预测和展望.  相似文献   

18.
大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8.  相似文献   

19.
NPSP:一种高效的序列模式增量挖掘算法   总被引:4,自引:3,他引:1  
提出了一种称为“异构树”的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程,在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性.  相似文献   

20.
数据挖掘方法可以处理庞大的日志审计数据,并更快地提取入侵模式.提取网络入侵模式所用的2个核心算法是关联规则算法和序列规则算法.它们被用于提取每个连接记录内部和记录间的特征模式.在原算法的基础上,采用向量标识频集的方法,使其较好地达到时间和空间的平衡.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号