首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对现有入侵检测系统在处理大量数据时,挖掘速度慢,自适应能力差的缺点,引入了数据挖掘技术使其能从大量数据中发现入侵特征和模式,提出了一种基于数据挖掘技术的入侵检测系统模型,并研究了建模过程中用到的算法.  相似文献   

2.
在现有数字化地震前兆观测数据的基础上,研究可行的数据挖掘算法和地震数据可视化方法,设计可行的基于地震前兆数据的可视化数据挖掘的模型,为地震预测提供决策分析支持.  相似文献   

3.
抽象的聚类分析是数据挖掘研究的重要领域.随着数据量每3年翻一番,关键问题是如何对大型数据集高效率地进行聚类操作.文章首先将当前主流的聚类算法应用于大规模数据集,通过实验指出现有的聚类技术存在的关键问题及所面临的技术挑战,然后使用了数据聚合树(DA树)作为代表性大型数据集的数据结构,设计了一个新的聚集算法(CLUK算法)...  相似文献   

4.
数据挖掘就是利用机器学习的方法从大量数据中提取有价值知识的过程.本文以运动员体能测试数据为分析对象,研究应用数据挖掘技术解决运动员体能指标优化分析问题的方法.文中重点介绍了关联规则挖掘的原理与方法,提出并实现了适宜于网球运动员体能指标优化分析的算法,并进行了实际应用,发现了出乎常规的规律.  相似文献   

5.
为解决传统数据挖掘应用到网络时空数据挖掘时存在挖掘结果数据召回率低的问题,研究基于人工智能的网络时空数据挖掘方法.采用网络爬虫技术采集网络时空数据,制定网络时空数据关联规则,利用人工智能中的微分进化算法进行挖掘数据筛选及候选集确定,基于用户偏好挖掘数据知识,实现网络时空数据的挖掘.试验结果表明,设计方法在实际应用中能够...  相似文献   

6.
数据挖掘与数据库的集成方法   总被引:5,自引:0,他引:5  
数据挖掘的研究主要集中在挖掘算法上,但在数据库领域至关重要的数据挖掘系统与数据库的有效集成研究却很少,为此,在详细研究了数据挖掘耦合数据库的主要方法(通过SQL(Structured Query Language)游标接口读取数据、保存数据至本地磁盘cache进行挖掘、用存储过程封装挖掘算法、采用用户自定义函数表达挖掘算法以及通过扩展SQL直接操作挖掘模型)的基础上,指出在实现数据挖掘同数据库无缝集成的发展过程中,在现有的DB/DW中集成数据挖掘系统并提供应用程序和自定义挖掘算法的接口、研究推出标准数据挖掘语言是实现数据挖掘系统与数据库有效集成的关键技术。  相似文献   

7.
为了弥补基于集中式处理的分布式数据挖掘方法的不足,有效地实施分布式数据挖掘(DDM)任务,需要一种能从分布式数据源中获取多样化代表性取样集的技术.提出了一种新的适用于分布式数据挖掘环境的数据取样算法(OptiSim-DDM方法),算法核心是基于最优K相异性进行数据选择,采用移动Agent技术和扩展的最优K相异性数据多样化代表性子集选择方法,能在各分布式数据场地中轮转选择出全局数据集的多样化代表性取样集.该方法通过降低所挖掘的数据集的数据规模来降低数据挖掘算法的时空复杂度,降低网络通讯代价,提高数据挖掘的执行效率,适合于各场地数据是互相关联和互相依赖的分布式数据挖掘任务.实验结果证实该方法是可行、有效的.  相似文献   

8.
数据挖掘技术从产生以来得到了广泛的研究和应用,在数据的分类技术方面C4.5算法的研究已经比较成熟,但在学生成绩挖掘方面的应用比较少,本文首先论述了主要分类技术,详细介绍了C4.5决策树分类算法,并以实际学生成绩数据为依据,进行学生成绩的数据挖掘,通过对挖掘结果的分析表明,C4.5决策树算法高效、准确,是对学生成绩数据挖掘的首选工具.  相似文献   

9.
对数据挖掘技术及其在电力系统中的应用情况进行了简要介绍。基于长期运行的电力生产事故统计分析系统积累了大量的事实数据,可以通过这些数据之间的关系来挖掘内含的规律,因此文章引入了一种基于数据挖掘的关联规则算法来挖掘出电力事故中的相关规则,进而通过这些规则来研究事故发生的规律。  相似文献   

10.
基于Rough集的数据挖掘在教学评价中的应用   总被引:2,自引:0,他引:2  
基于粗集的数据挖掘的主要过程是数据预处理、约简及规则提取.为了分析教师教学行为和教学效果之间的关系,以教学评价的数据为基础,利用基于粗糙集的数据挖掘技术进行挖掘.实例研究中采用基于分明矩阵的属性约简算法和启发式属性值约简算法,去掉决策表中的冗余属性和属性值,得到了影响教学效果的关键因素刎和相关规则.  相似文献   

11.
本论述对低保数据的挖掘中,使用了两种挖掘算法,另外配合SQL Server 2010提供的数据挖掘功能对低保数据进行了全面的分析,介绍了OLAP技术和数据挖掘在低保数据分析中的应用.主要内容包括:分析了数据挖掘技术在低保数据分析中的应用意义;研究了关联规则、决策树算法、聚类分析在低保数据分析中的应用.这也是低保信息化工作今后重要的研究目标和发展方向.  相似文献   

12.
数据挖掘是对大量数据进行分析和理解,并提示其内部所蕴藏的丰富知识的技术.文章研究数据挖掘技术中关联分析方法的某些算法,并据此对嘉兴电大教务系统中的成绩数据和一些实测数据进行挖掘研究,从而得出了学生学习动力和有关因素的关联性分析的一些初步结果.  相似文献   

13.
聚类分析在入侵检测中的应用   总被引:1,自引:0,他引:1  
在对现有的入侵检测技术研究的基础上,着重对数据挖掘技术中的聚类分析方法在入侵检测领域中的应用进行了研究。通过分析网络中数据的特点,提出了一种基于改进的k-means算法的无监督二次聚类算法,并用入侵检测权威数据集KDD Cup1999作为实验数据将其实现,实验表明,该算法具有较高的检测率和较低的误检率。  相似文献   

14.
分布式数据挖掘计算是大数据研究中非常重要的技术,现有的对频繁模式的分布式挖掘方法在处理大量数据集时仍然存在许多局限,如并行Apriori算法在多次扫描数据库过程中对I/O产生很大负担,并且有大量候选集产生.本文使用的FP-growth算法包括Fp-tree构建和频繁模式挖掘两个阶段.主要思想是在map阶段构建FP-tree之前,根据步长值及项目元素编码对FP-tree节点合并,并在shuffle阶段依据平衡算法划分给不同的reducer.平衡算法用来均衡工作负载.利用该算法来降低数据分配的随机性,避免数据挖掘阶段由于数据划分不均衡导致部分reducer开销过大的缺点.实验结果表明:与现有方法相比,在较大数据集情况下改进后的算法具有更好地运算效率和可伸缩性.  相似文献   

15.
针对对海量数据库中的大数据进行优化挖掘,可以提高数据特征的提取和检测能力.传统方法采用模糊C均值聚类的数据挖掘算法,当数据在层次聚类过程中空间特征的相似度差异性较小时,数据挖掘的准确度不高.提出一种基于粒子群混沌差分训练对模糊C均值聚类算法进行改进,建立数据挖掘优化模型.首先提出了数据聚类据挖掘模型的总体构架,采用非线性时间序列分析方法进行数据信息流拟合,对数据信息流进行高阶累积量特征提取,采用粒子群混沌差分训练实现模糊C均值聚类算法改进.以改进的模糊聚类算法对提取的高阶累积量特征进行聚类分析,以分析结果为依据对数据挖掘模型进行优化.仿真结果表明,该数据挖掘模型能有效实现海量数据的优化聚类和特征提取,数据挖掘的精度较高,性能较好,避免挖掘过程陷入局部收敛.  相似文献   

16.
本文针对图书馆数据低效利用的现状,采用了基于R的数据挖掘技术对图书馆借阅数据进行了深入挖掘,以期发现这部分数据所隐含的价值。通过数据挖掘从借阅数据中探索其中隐含的规律,并将挖掘出的规律信息进行实际应用,从而实现数据挖掘对数据中价值的发现和高效利用。  相似文献   

17.
健康档案数据仓库的存储模型支持数据共享与交换、数据挖掘与分析.使用数据挖掘技术可以在海量的信息数据仓库中提取隐含的、潜在的、有价值的数据进行分析.利用Microsoft决策树算法的线性回归算法对数据进行慢性病诱因的数据挖掘具有重要的参考价值.  相似文献   

18.
数据挖掘中分类算法的可扩展性研究   总被引:1,自引:0,他引:1  
分类是数据挖掘中最重要的技术之一,而且应用领域非常广泛,但面对新出现的海量数据,目前已有的许多分类算法不具备良好的伸缩性,不能从巨大的数据集中快速而准确地发现有用的知识.针对这一问题,本文对分类算法的可扩展性方法进行了深入的研究,并对各种方法进行了分析和对比,从而便于研究和开发者对已有的算法进行改进和扩展,以适应数据挖掘技术的不断发展.  相似文献   

19.
离群数据挖掘是数据挖掘中的重要内容.本文针对时间序列数据进行离群数据挖掘方法的研究.在引入了基于局部离群点因子的离群数据挖掘方法与时间序列上滑动窗口基础上,将二者相结合,提出了基于滑动窗口的时间序列离群数据挖掘算法,并将算法应用于海表温度数据得到海表温度的异常之处.  相似文献   

20.
随着互联网技术的快速发展与普及,尤其是Web2.0时代的来临,网络数据量与日俱增.对新增数据进行挖掘成为数据挖掘领域研究的热点之一.基于存在全局站点的分布式数据挖掘思想,提出了一种存在全局站点的分布式增量挖掘算法.首先对局部站点的增量数据进行全局挖掘,有效减少了局部站点对原有数据的扫描次数;然后在全局站点采用新的剪枝策略,极大地降低了产生的候选集数量;最后通过实例验证了所给算法切实可行,并具有较好的挖掘效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号