共查询到19条相似文献,搜索用时 62 毫秒
1.
针对时间序列中孤立点的挖掘.提出了基于统计分布的小波分析时孤立点数据的挖掘.首先对所采集到的数据进行排序得出经验分布函数,并估计出经验分布函数与总体分布函数之间的差异;然后利用再抽样的方法缩小子样分布函数与总体分布函数之间的差值,在允许的差值之下,利用子样分布函数代替母体分布函数;最后用小波分析对孤立点进行识别与挖掘. 相似文献
2.
在时间序列数据挖掘领域,对孤立点的研究已经成为关注的热点。结合证券领域数据在时间和取值方面的相关特征,提出了一种新的孤立点探测方法,以便在海量数据中高效快速的寻找出证券领域数据集合中的孤立点,研究产生这些异常数据的原因,及时发现金融欺诈等违法行为,以便规避风险、保护用户利益。 相似文献
3.
孤立点检测在信息科学研究领域日益受到重视,本文系统地综述了数据库研究领域中孤立点检测的研究现状,对已有各种孤立点检测方法进行了阐述和比较,展望了孤立点检测未来的研究方向及其面临的挑战。 相似文献
4.
文章讨论了孤立点检测在零售业中的应用,并在基于距离和的孤立点检测算法基础上,对孤立点的具体位置做了进一步的确定,结合实际数据进行了验证分析,分析结果表明,此方法不仅可以有效的检测出零售业中消费者购买行为的波动情况,而且可以确定出孤立点的位置。 相似文献
5.
基于数据仓库技术的大坝资料分析与安全决策系统研究 总被引:1,自引:0,他引:1
在现有基于数据库技术的大坝安全监测系统研究的基础上,结合工程项目的具体情况以及大坝监测数据分析的特点,设计及构建了大坝安全监测数据仓库系统,为监测资料的分析查询、信息挖掘和综合评判提供了良好的数据环境.利用联机分析处理(OLAP)与数据挖掘(DM)技术对监测数据仓库中的数据进行了分析和挖掘,使安全监控资料的作用得到了进一步的发挥,为安全监控评判和决策的深化提供新的途径. 相似文献
6.
孤立点检测问题是数据挖掘领域中的一个重要研究内容.首先对目前有代表性的孤立点检测算法进行综述,详细阐述了其实现的基本原理、实现的步骤和应用范围,进而对这些典型算法的优缺点进行了分析与比较,随后介绍了几种孤立点的典型应用,最后对孤立点检测算法的发展趋势从4个方面进行了展望. 相似文献
7.
基于相似系数和的孤立点检测算法 总被引:1,自引:0,他引:1
简要介绍了一个基于相似系数和的孤立点检测聚类算法,指出了它的局限性,在此的基础上,文中提出了一个改进的算法.算法的思想是,对数据集进行标准化,然后构造一个相似系数矩阵,通过对象的相似系数之和判断对象的孤立程度.改进后的算法除了可以检测出倍数异常孤立点外,还可以检测出分量异常孤立点. 相似文献
8.
孤立点检测是数据挖掘中一个重要方面,用来发现“小的模式”(相对于聚类),即数据集中显著不同于其他数据的对象.在以往的数据挖掘应用中,孤立点经常被当作“噪声”而被剔除.为更好地提高入侵检测系统中的实时性和准确性,提出了新的解决方案. 相似文献
9.
利用3D空区探测系统(CMS)采集矿山采空区点云数据为线扫描方式,在三维重建之前对点云数据进行平滑处理是一个必要的环节.提出了一种基于小波变换的采空区点云数据平滑方法,该方法主要分为三维扫描线的降维处理和信号平滑滤波2个步骤.对采空区的三维激光扫描线,用弧长为参数进行参数方程分解,将三维空间扫描线分解到3个方向上,利用一维信号处理方法分别进行小波平滑处理,再将平滑处理后的数据重建扫描线.通过在MATLAB环境下对某采空区的一条扫描线进行了仿真实验,证明了该方法有效的解决了采空区三维激光扫描线的不光滑问题. 相似文献
10.
为了从数据集中快速有效地发现孤立点,提出了一种基于网格模型的孤立点检测方法,给出了数据空间的网格划分,定义了网格内孤立点存在性阈值,提出了基于网格的孤立点检测算法,在保证算法有效性的前提下,降低了算法的时间复杂度。 相似文献
11.
数据仓库最重要的特征就是实现数据的集成与共享.基于统计数据仓库的数据分析系统众多,因此首先对统计数据仓库体系进行研究,然后对联机分析、决策支持及数据挖掘这3类分析工具进行对比研究,并通过介绍"万峰统计数据仓库"中数据分析部分的功能及划分,为统计数据仓库数据分析系统的研发提供了理论基础和实践依据. 相似文献
12.
公路管理数据仓库及其数据分析技术 总被引:1,自引:1,他引:0
探讨现代公路管理对挖掘信息潜力的需求 ,通过比较实现信息挖掘技术方案的异同点 ,提出建设公路管理数据仓库的内涵 ,在此基础上 ,结合具体工程案例 ,对公路管理数据仓库的多维分析与数据挖掘两类主要数据分析技术进行了深入研究。 相似文献
13.
根据现有电信公司内部系统,设计并实现了基于数据仓库的经营分析系统,实现跨平台数据抽取、清理和转换.该系统能够满足电信日常经营分析,为电信公司分析提供一个可靠的数据支撑,从而降低领导拍板决策方式带来的风险. 相似文献
14.
15.
传统的多维分析是维值为确定的一种分析方法,但在实际分析过程中,由于环境的复杂不确定性,分析人员常常提出一些维值不确定的分析需求.在分析讨论多维模糊分析概念的基础上,采用模糊隶属度函数的概念,通过将维表数值的模糊化处理和基于模糊化维值完成事实表转换,提出了一种基于数据仓库的多维模糊分析方法,给出了相应的转换过程和算法.分析结果表明,基于数据仓库的多维模糊分析方法可有效提高多维分析的灵活性和适应性. 相似文献
16.
构建大型企业的数据仓库 总被引:2,自引:0,他引:2
提出一种多层次数据仓库系统结构.这种构架的数据仓库开发过程不同于通常软件的开发.各结构层次的侧重点不同,引入的开发工具、采用的开发方法各有不同.这种系统结构适合大型企业分步投资、分阶段建设数据仓库. 相似文献
17.
基于并行数据仓库的数据分布调整策略 总被引:1,自引:0,他引:1
并行数据仓库系统的性能与数据在多处理机之间的分布密切相关.本文根据并行数据仓库系统的体系框架,提出了全新的并行数据仓库数据三层模式结构,并在此模式基础上,根据用户查询的变化设计了动态多维数据分布和调整策略,通过改变数据分布模式和数据物理存放的方式来保证系统数据分布均匀和工作负载均衡.实验结果证明,此算法能有效地缩短OLAP平均查询响应时间,提升系统的整体性能. 相似文献
18.
空间数据库存储空间对象的相关信息,在很多实际应用中需要汇总空间数据,但这种汇总非常耗费时间而且计算代价很高.受非空间数据仓库的启发,可以建立空间数据仓库来加速空间OLAP操作.考虑星型模式且着重于空间维的概念分层,这种分层主要根据空间R-树索引来建立.提出了一个空间查询算法,并考虑了数据更新. 相似文献
19.
张天丹 《佛山科学技术学院学报(自然科学版)》2011,29(5):68-71
提出一种基于系统开发生命周期的改造的高校数据仓库的开发流程,并介绍每一个阶段的主要任务及策略。高校数据仓库能够为访问校内各种类型的数据提供统一的平台;能够方便地转换管理信息系统中的动态业务数据;能够方便地进行查询、数据分析和数据挖掘。开发高校数据仓库需要按照一定的策略和方法,才能够提高成功率和效率。 相似文献