首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 839 毫秒
1.
数据挖掘中数据预处理技术综述   总被引:17,自引:0,他引:17  
数据挖掘是数据库系统和信息决策领域的前沿研究方向。论述了数据预处理在数据挖掘中的重要地位,介绍了数据预处理所包含的内容和采用的方法。  相似文献   

2.
陶苏琴 《河南科技》2023,(15):112-115
【目的】大数据时代背景下,通过对企业数据的法律价值和法律保护方式进行分析,为我国企业数据保护方式提供思路和建议。【方法】通过文献研究和比较研究法,梳理企业数据的法律性质,以及不同法律保护方式的优点和不足。【结果】现行法律保护模式包括著作权、商业秘密及《反不正当竞争法》等均存在保护困境,我国企业数据保护仍需要研究新的保障措施,探索新的方向。【结论】本研究提出创设企业数据权等保护方式,为更好地保护企业数据提供新方向和新思路。  相似文献   

3.
【目的】目前,交通运输行业各个系统间的信息孤岛问题严重。通过数据资源规划和数据库设计,建设大数据平台数据资源体系,从而实现对交通运输行业数据资源的统一规划、组织、管理、存储和深度利用,加强各类信息间的分析及服务,解决交通运输行业信息资源缺乏整合共享的问题。【方法】交通运输行业数据体系设计主要包括数据资源规划、数据资源体系设计、数据治理和数据交换这四部分内容,数据资源体系是在数据资源规划的基础上,根据数据的属性和用途的不同,将其归纳形成服务于各业务应用系统的基础数据库、业务数据库、主题数据库和共享数据库,从而明确不同数据资源间的组织和管理方式。【结果】数据治理是通过对公路、水路交通运输行业数据资源进行综合管控,保障数据的准确性、一致性、完整性、可用性和安全性。【结论】数据交换负责行业内不同层级部门之间跨部门数据交换,解决跨部门、跨业务的数据共享问题。  相似文献   

4.
为了提升车辆管理系统的应用效果及用户满意度,设计一种基于Hadoop的车辆管理系统.该系统是以Hadoop为核心的三层架构,数据存储层利用数据采集接口接收交警侧采集终端传输的车辆数据,经数据加载、查询、存储后,通过数据访问服务接口将数据传输至服务层.服务层利用Min-Max方法获取车辆移动近似节点和车辆短时位置信息,获取最终的车辆节点定位结果,可实现车辆历史信息查看和预警信息发送,同时将逻辑处理结果经服务通信接口传输至显示层显示.实验结果表明,该系统的吞吐量较高,可允许大批量用户同时访问;车辆定位结果的均方根误差较低,定位较为精确;系统执行时间低,可快速响应用户需求,且用户满意度较高.  相似文献   

5.
大数据时代的到来,使我国在现代化建设过程中对信息化技术的应用不断加深,这也使数据量增长速度不断加快,随之而来的数据存储问题也变得越来越突出。如何对海量数据进行有效存储,大幅提高数据访问率,保障数据安全,已经成为亟待解决的重要问题。而数据分级存储技术的出现,为这一问题的解决提供了可靠的技术支持。鉴于此,本文首先分析大数据时代数据分级存储及其基本要求,然后对数据分级存储的优化方向进行深入研究,以期为我国数据分级存储技术的优化与改进指明方向。  相似文献   

6.
互联网使地球"平坦化",也将世界引领到一个信息爆炸的时代。随着数据量的迅猛增长,存储成本不断攀高,如何降低存储使用量成为当代计算机领域的一个热点研究课题和一个亟待解决的关键技术问题。重复数据删除Deduplication是存储系统中一种流行的数据压缩策略,它能够消除重复数据,达到数据压缩进而减少存储量的效果,尤其适用于备份数据的压缩管理。本文主要对重复数据删除的技术发展路线和专利技术申请综述。  相似文献   

7.
在河南省大力发展数字城市之际,河南省测绘工程院承接了大量的数据建库任务,在不断的生产实践中,该院针对大比例尺数据库建设的特点,建立了一套科学的作业流程,不断改进和完善,提高整体作业效率,高质量地提供满足客户方要求的大比例尺数据库。本文简要说明了大比例数据库数据入库前的处理流程,并对每个流程中该注意的问题加以阐述。  相似文献   

8.
人工神经网络BP算法密集型数据的预处理   总被引:11,自引:0,他引:11  
针对误差反向传播算法密集数据输入问题,提出一种数据预处理方法。模拟实验表明,采用这种预处理技术可以极大地改善密集型数据输入时网络的学习效率。  相似文献   

9.
随着互联网技术的不断发展,数据的产生呈现出爆炸式增长,一系列信息数据的出现意味着大数据时代的来临。如何从海量的数据中提取具有价值的信息,再将这些有用的信息反馈给用户,已成为未来图书馆信息服务发展的趋势。大数据时代为图书馆带来了更多的发展机遇,同时也对图书馆的信息服务管理提出了一些挑战。只有抓住机遇,并找出解决问题的途径,才能更好地服务读者,从而增强图书馆的竞争力和影响力。  相似文献   

10.
开放数据是金矿,人们可以对这些数据进行自由阅读、分享、发布和使用,通过对开放数据的"开采",可以挖掘出其隐藏的价值和作用,寻求数据最大可能的无限获取和重用。本文追溯开放数据的产生背景,详细介绍开放数据的概念和特点,进而探讨开放数据在电子政务、商业以及图书馆中的应用,以期能有更多学者加大对开放数据的研究,充分发挥开放数据的价值。  相似文献   

11.
基于粗集理论不完备数据的改进算法   总被引:1,自引:0,他引:1  
刘伟 《松辽学刊》2007,28(3):113-114,130
由于经典的粗糙集理论不能处理原始数据中的遗漏信息,需要对这些数据进行补齐才能用于知识获取.因此数据预处理在粗糙集理论应用中非常重要的一环,其结果将直接影响到粗糙集理论应用的效率、准确度.所以有关基于粗集理论的数据挖掘中数据预处理的方法研究具有非常重要的意义.本文分析了当前主要数据补齐算法的特点和不足,并针对已有的基于粗糙集理论的不完备系统补齐算法ROUSTIDA的缺陷,提出了改进的数据补齐算法,使更多的缺损数据得到填补,尽量避免可能导致的决策规则矛盾问题.  相似文献   

12.
通信计费数据采集与传输融合的研究   总被引:1,自引:0,他引:1  
网络与通信的迅速发展,要求计费数据采集与传输要适应计费的发展.越来越多的网络、交换机种类、业务类型、服务要求和用户终端,要求计费数据采集与传输能够融合多个网络,支持多种类的交换机和业务类型,满足尽可能多的服务要求,兼容尽可能多的操作系统以用来满足不同终端的用户.针对这些要求,对计费数据采集与传输模型及计费数据的采集方式、交换机对数据采集提供的支持进行了研究和探讨.  相似文献   

13.
过程数据压缩研究是流数据管理中的一个重要课题,现有的流数据压缩方法都强调其动态性、持续性与海量性,没有考虑到过程数据的具体特性.为了有效利用过程数据采样的局部特性,在对过程数据进行采样时,只要采样区间不大,则相邻样本数据值之差比较少,该文提出了一种基于误差传播的压缩方法.实验表明,该方法具有高效率与低误差等优点.  相似文献   

14.
介绍了数据仓库的体系结构和功能,对OLTP和OLAP进行了比较,对在已有数据库基础上创建数据仓库出现的多模式间不配匹、约束不一致和属性值冲突等问题进行了分析,并结合作者的实践给出了相应解决方案或设想,最后给出了数据仓库领域进一步研究的几个问题。  相似文献   

15.
讨论了分布式数据流处理的需求以及重叠网络的特点。在Chord模型的基础上,提出了一种支持分布式数据流处理的双层重叠网络模型,并给出了构建模型的有效算法,最后通过应用验证了该模型的有效性.  相似文献   

16.
数据仓库技术及其应用   总被引:2,自引:0,他引:2  
着重阐述了数据仓库的基本概念、系统框架结构以及发展前景与方向,并结合项目实例对数据仓库系统的数据源、数据源集成、中心数据仓库、数据集市、OLAP服务器和前端分析工具等组成部分进行了详细分析.  相似文献   

17.
阐述了数据仓库的产生、数据仓库的概念、数据仓库的三大组成部分、数据仓库技术存在的问题以及研究方向,探讨了如何构建数据仓库进行决策支持.  相似文献   

18.
介绍了机器数在数轴上的几何表示方法,并用此方法分析了补码运算的溢出问题.  相似文献   

19.
基于XML的异构数据集成领域的应用研究   总被引:4,自引:0,他引:4  
叶蕾  郭玲  胡建华 《松辽学刊》2003,24(3):21-23
XML作为一种半结构化的数据模型,在异构数据集成方面显示了强大的力量。本文主要介绍了基于XML技术的异构数据存取与集成的具体框架,并详细介绍了该框架实现的关键技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号