首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
数据挖掘中数据预处理技术综述   总被引:17,自引:0,他引:17  
数据挖掘是数据库系统和信息决策领域的前沿研究方向。论述了数据预处理在数据挖掘中的重要地位,介绍了数据预处理所包含的内容和采用的方法。  相似文献   

2.
介绍了数据仓库技术的概念、特点,描述了数据仓库的关键技术,在此基础上,对数据仓库在电子商务中的地位及作用进行了探讨。  相似文献   

3.
基于XML的异构数据集成领域的应用研究   总被引:4,自引:0,他引:4  
叶蕾  郭玲  胡建华 《松辽学刊》2003,24(3):21-23
XML作为一种半结构化的数据模型,在异构数据集成方面显示了强大的力量。本文主要介绍了基于XML技术的异构数据存取与集成的具体框架,并详细介绍了该框架实现的关键技术。  相似文献   

4.
介绍了基线算法的构思原理,用Neilib数据和随机生成的数据对几种具体的实现形式进行了测试,并与单纯形法进行了比较。理论和数值结果表明基线算法是一种可靠,有效的算法,此外,还给出了有关于其它算法(包括内点算法)的若干评述。  相似文献   

5.
基于Web Log的数据预处理研究   总被引:4,自引:0,他引:4  
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步,首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法。  相似文献   

6.
陶苏琴 《河南科技》2023,(15):112-115
【目的】大数据时代背景下,通过对企业数据的法律价值和法律保护方式进行分析,为我国企业数据保护方式提供思路和建议。【方法】通过文献研究和比较研究法,梳理企业数据的法律性质,以及不同法律保护方式的优点和不足。【结果】现行法律保护模式包括著作权、商业秘密及《反不正当竞争法》等均存在保护困境,我国企业数据保护仍需要研究新的保障措施,探索新的方向。【结论】本研究提出创设企业数据权等保护方式,为更好地保护企业数据提供新方向和新思路。  相似文献   

7.
【目的】目前,交通运输行业各个系统间的信息孤岛问题严重。通过数据资源规划和数据库设计,建设大数据平台数据资源体系,从而实现对交通运输行业数据资源的统一规划、组织、管理、存储和深度利用,加强各类信息间的分析及服务,解决交通运输行业信息资源缺乏整合共享的问题。【方法】交通运输行业数据体系设计主要包括数据资源规划、数据资源体系设计、数据治理和数据交换这四部分内容,数据资源体系是在数据资源规划的基础上,根据数据的属性和用途的不同,将其归纳形成服务于各业务应用系统的基础数据库、业务数据库、主题数据库和共享数据库,从而明确不同数据资源间的组织和管理方式。【结果】数据治理是通过对公路、水路交通运输行业数据资源进行综合管控,保障数据的准确性、一致性、完整性、可用性和安全性。【结论】数据交换负责行业内不同层级部门之间跨部门数据交换,解决跨部门、跨业务的数据共享问题。  相似文献   

8.
人工神经网络BP算法密集型数据的预处理   总被引:11,自引:0,他引:11  
针对误差反向传播算法密集数据输入问题,提出一种数据预处理方法。模拟实验表明,采用这种预处理技术可以极大地改善密集型数据输入时网络的学习效率。  相似文献   

9.
介绍了城市坐标系统GPS点位遭到破坏后的恢复方法.首先将不同时期、不同品牌GPS接收机采集的数据纳入网中,然后进行数据检核、基线处理、平差解算,可获得被破坏GPS点的数据.通过对比1980西安坐标系、1954北京坐标系、城市坐标系统的成果,可以看出补测后的坐标与原坐标非常接近,有相同的精度,说明GPS点恢复方法是可行的.  相似文献   

10.
一、数字的起源 数字是原始人最早的文字,原始人时期的数字以记数量为主,古书中有“上古结绳而治”、“大事作大结,小事作小结”的记载。虽然原始人的数字处于单纯的状态,但已初具了单数与双数,个位与十位的数据特征。  相似文献   

11.
运用差分法和最小二乘法原理,提出了一种处理温升试验数据的新方法,只要利用二次观测值,不仅能预估最终稳定温升,而且能预测温升试验的时间响应,尤其适应于微机控制的温升试验数据处理。  相似文献   

12.
阐述了《中国学术期刊(光盘版)》人编期刊执行《中国学术期刊》I(光盘版)检索与评价数据规范》的必要性,提出了执行规范的措施,并对执行规范中存在的问题提出了建议。  相似文献   

13.
本文结合半导体致冷这一特定器件,通过实验,确定了给具有一定热源物体降温的条件,从而对其测温,控制电路的工作原理进行了较详细的分析,给出了一些必要的波形图和参数计算公式,具有一定的实用价值。  相似文献   

14.
田海 《河南科技》2001,(12):10-11
我国保险业经过几十年的发展,已经取得了巨大的成就,保险市场有了广泛的拓展,保险业已经成为国家经济生活中的一个重要组成部分,但是我们也要看到,我国保险业的发展也才刚刚起步,与世界发达国家的先进水平相比还有差距,特别是随着我国保险市场对外国公司的逐步开放,保险业的竞争将日趋激烈。我国保险公司如何在将来的市场竞争中立于不败之地,是一个值得所有保险从业人员思考的重要问题。而电子商务的出现为我国的保险业提供了一个极为有利的发展机会,如果能够抓住这个发展的机遇,将电子商务引入到我国保险业中来,那么我国保险业…  相似文献   

15.
针对当前校园扶贫工作普遍存在的“隐形贫困”及疑似“虚假贫困”等问题,提出了利用随机森林算法和决策树的贫困生认定方法首先,利用智慧校园大数据环境获取高校内学生的基本信息、消费信息等数据,找出10个具有分类能力的特征;然后使用基于permutation随机置换的残差均方减小量来衡量对于变量重要性评分;最后,基于随机森林算法和决策树进行判别与分类实验结果表明,提出的方法具有一定的准确性,相比Adaboost方法,无论是预测准确度还是平均绝对误差,随机森林方法都更出色  相似文献   

16.
通过对遗传程序设计应用的研究,得出了使用遗传程序设计在数据拟合中的广泛应用及其普遍方法,规则,与技巧,并使用BorlandC++对各实例进行拟合。实验证明,遗传程序设计在数据拟合问题中的大多数方面优于传统的拟合方法。  相似文献   

17.
研究了在色谱数据处理器CR-3A上进行一元,二元线性回归数据处理的BASIC程序设计,该程序能处理色谱定量过程中标准校正曲线的一元线性回归,给制标准工作曲线拟合图,并给出线性方程和相关系数,也能处理象保留规律方程:Ln^^1=a+bLnV+CV及范迪姆特方程:H=A+B/U+CU等二元线性回归数据处理,扩展了CR-3A数据处理器的处理功能。  相似文献   

18.
高磊 《河南科技》2001,(11):28-29
商用网络在互联网上得以运行,首先应建立 或使原 有的网 络升级 为内部 网,而专 用的内 部网与 公用的 互联网的隔离则有赖于防火墙技术。有了防火墙,商家们便可以比较安全地在互联网上进行相应的商业活动。 1.防火墙技术 “防火墙”是一种形象的说法,其实它是一种由计算机硬件和软件的组合,使互联网与内部网之间建立起一个安全网关(sity gateway),从而保护内部网免受非法用户的侵入。所谓防火墙就是一个把互联网与内部网隔开的屏障。防火墙有二类,标2B防火墙和双家网关。标准防火墙系统包括一个洲IX工作站,该工…  相似文献   

19.
介绍了笔者将馆藏数据CNMARC化的方法及体会。从技术方案的选定、转换语言的选择、对现有.DBF馆藏数据的分析等入手,分析将.DBF格式数据转换成MARC格式的过程,最后提出使用VB语言和ACCESS数据库将.DBF转换成MARC文本的算法。  相似文献   

20.
互信息在时间序列分析中的应用   总被引:6,自引:0,他引:6  
介绍了由信息理论定量计算两序列S、Q之间的互信息I(S,Q)=ΣP(si,qi)。log〔P(si,qi)/P(qi)〕的方法;并根据周期系统,混沌系统、随机系统的一维时间序列及其时间延迟序列间的互信息估算结果,分析数据的可预测性,得出序列预测准确性的最大极限;现根据以上三类系统的二维时间序列间的互信息估算结果,估价数据所提供的信息的新颖性,从而可以避免一些重复性的工作所造成的浪费,与互相关相比,  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号