首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 745 毫秒
1.
分析了现有CAD数据与GIS数据转换的研究成果,在分析AutoCAD与ArcGIS数据特点的基础上,提出并设计了基于规则库的CAD数据到GIS数据转换方法,并基于该方法开发应用程序,通过在实际数据生产中的应用分析,该方法的优点是可避免数据转换过程的信息丢失和建立完整要素关系,并可通过规则库实现转换过程及质量的可控制性。  相似文献   

2.
交互式数据迁移系统及其相似检测效率优化   总被引:7,自引:0,他引:7  
为保证数据迁移后新系统的数据质量,把数据清理应用于数据迁移之中,提出一种集成数据清理的交互式数据迁移系统,并分析其工作原理.为了提高该系统中相似重复记录的检测效率,在相似重复记录检测中采用长度过滤等方法优化相似检测算法,避免了不必要的编辑距离计算,从而提高了整个数据迁移系统的数据迁移速度.此外,构造了合适的实验环境,作了大量的检测实验,实验结果验证了长度过滤方法的科学性.  相似文献   

3.
一种通用的多数据库间数据抽取方法及应用   总被引:4,自引:0,他引:4  
为方便从多个异构的数据源中抽取转换数据、并加载到目标数据库,提出一种较为通用的抽取方法,并开发了工具软件.该方法基于客户端的方案,使用数据库驱动程序屏蔽异构数据库间的差异;数据的抽取、转换和加载由数据抽取软件执行;数据的抽取转换基于抽取规则,抽取规则采用可视化方法编辑生成;抽取规则存储于规则库,供多次调用修改;多个抽取任务组成抽取任务队列.开发的抽取工具软件DbBridge,支持从Oracle,SQL Server,SAS,Access,Excel等数据源抽取数据.软件成功应用于某数据仓库的建立及数据迁移工作.  相似文献   

4.
针对数据迁移中ETL技术的实现问题,指出可以通过构造输入数据库和中间数据库,利用Datastage工具和PL/SQL程序相结合的方式进行数据迁移.给出了Datastage工具的应用策略和PL/SQL程序实现ETL过程的具体流程.实践表明该方案数据迁移速度较快,能够较好地完成海量数据的迁移任务.  相似文献   

5.
论文分析了现有CAD数据与GIS数据转换的研究成果,在分析AutoCAD与ArcGIS数据特点的基础上,提出并设计了基于规则库的CAD数据到GIS数据转换方法,并基于该方法开发应用程序,通过在实际数据生产中的应用分析,该方法的优点是可避免数据转换过程的信息丢失和建立完整要素关系,并可通过规则库实现转换过程及质量的可控制性。  相似文献   

6.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

7.
肖明 《科技信息》2007,(21):43-45
本文给出了一种规则库的概念来扩充数据库应用系统的校验的功能,使系统能够对规则进行动态读取和分析,并根据分析结果对输入数据进行动态校验.本文介绍了数据库报表系统中的校验模型,并运用一种规则库执行流图REBF描述了规则库图模型,之后论述了该系统中具体的规则库的建立及规则表结构,并通过对推理过程的不确定性的分析,证明了规则的有效性,最后给出了基于规则的动态分析及推理过程.  相似文献   

8.
针对目前传统关系型数据库中的历史数据向非关系型数据库迁移的低效率问题,提出利用多叉树模型对历史数据存储模式进行重构.基于4种模式迁移规则对各表节点之间的关联关系进行分析,推导算法完成传统关系型数据库中存储模式和历史数据的自动化迁移.该算法不受源数据库存储模式的限制,具有一定的通用性.数据迁移实验表明:在查询性能上,基于多叉树的迁移算法比官方迁移工具Sqoop有较大的提高.  相似文献   

9.
政府办公自动化信息系统数据迁移解决方案   总被引:2,自引:0,他引:2       下载免费PDF全文
赵钦  周丹 《广西科学院学报》2008,24(4):354-355,359
阐述政府办公自动化新旧系统数据迁移的意义,提出一种政府办公自动化信息系统数据迁移解决方案.该方案通过数据库结构分析、数据迁移流程设计和数据迁移实现3个步骤,可以正确、快速地实现政府办公自动化新旧系统的数据迁移,保证数据的完整性.  相似文献   

10.
基于RFID数据处理的公交停车场管理   总被引:2,自引:0,他引:2  
采用了基于J2EE架构的公交停车场管理信息集成技术,描述了一个Web应用系统,提供一个多层次的分布式应用模型。它可以使用户通过浏览器来管理公交停车场,该系统使用最新的JBOSS框架Seam来实现,Seam能很好地连接表现层和持久层,有利于保持公交停车场数据库管理的一致性和数据的动态更新和维护。同时采用了高效的RFID数据流清理框架,提出了一个可扩展接收器数据流的处理(GRSP)和声明式的基于查询框架,用来清理射频识别技术(RFID)传感器设备产生的数据流。实验证明,系统具有良好的性能和应用前景。  相似文献   

11.
数据清洗是提高数据集成质量的一个重要手段. 提出了一种基于动态规则的数据清洗方案AzszpClean,这种方法对各种清洗规则进行动态编译,将数据转换和数据清洗两者结合起来,强化清洗的描述能力. 实际应用表明,AzszpClean方法可以完成硬编码的功能,具有更高的实现效率.  相似文献   

12.
数据清理是KDD的首要步骤;没有好的数据环境,就不会有理想的挖掘结果.介绍了数据的一般特征,讨论了KDD中数据清理技术的清除空缺、噪声处理及不一致数据等问题,指出通用性和自适应性差是目前数据清理工具存在的主要问题.  相似文献   

13.
基于XML的异构数据源间数据交换的实现   总被引:1,自引:0,他引:1  
基于Web Service,XML设计开发了可配置的灵活数据交换集成中间件,阐述了数据集成中间件的关键难点部分的设计,如确定数据源、数据源数据和XML数据之间的映射、Select和Insert等命令的语法检查、转换规则的建立等.所开发的中间件在档案和办公系统的数据集成中得到了应用,很好地完成了对异构数据源数据的数据检索、交换、迁移以及数据更新的任务.  相似文献   

14.
在云数据中心的构造过程中,通过设计安全的架构来降低能量消耗是一种新的思路.提出了基于安全检测的虚拟机迁移策略,利用隔室技术及病毒传染模型(susceptible infected recovered,SIR)在虚拟机迁移过程把有安全威胁的虚拟机隔离出来,保证云数据中心的能量消耗与安全级别的平衡;参考Cloudsim项目中虚拟机迁移方法,将基于安全检测的策略分为安全虚拟机选择算法(security based selection,SBS)与安全虚拟机放置算法(security based placement,SBP);以Cloudsim云计算模拟器中的虚拟机选择及虚拟机放置策略作为性能比较对象.仿真实验结果表明,基于安全检测的虚拟机迁移策略可扩展性较好,可以抵御网络攻击,在能量消耗上只有少量的增加,可以作为其他云服务提供商构造云数据中心的参考模型.  相似文献   

15.
医疗数据中知识发现的研究   总被引:1,自引:0,他引:1  
介绍了ID3决策树算法建立决策树的基本原理和改进方法,利用改进的决策树算法对心脏病医疗诊断数据进行数据挖掘·采用VisualC++6 0进行编程建树,得到了一些有实际参考价值的诊断规则,获得了较高的分类准确率,证明了决策树算法在智能医疗诊断数据挖掘领域有着广泛的应用前景·  相似文献   

16.
遗传算法在数据挖掘中的应用   总被引:1,自引:0,他引:1  
本文对数据挖掘进行了概述,阐明了数据挖掘的概念、方法及其重要性。其次介绍了数据挖掘中的一个重要算法——遗传算法。对遗传算法的产生与发展以及主要理论等进行了简要的介绍,提出了基于遗传算法的关联规则的提取方法。最后结合实例给出了用遗传算法进行关联规则的挖掘方法。  相似文献   

17.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

18.
审计日志的关联规则挖掘   总被引:2,自引:0,他引:2  
研究了在入侵检测系统中利用数据挖掘技术从审计日志中挖掘关联规则的方法,针对现有关联规则算法应用于入侵检测系统引起的问题,提出了利用本质属性限制无趣规则的产生、利用行向量的位运算提高Apriori算法时间性能的一种高效改进算法。该算法不需生成候选频繁集和剪枝操作,避免了因无趣规则引起的大量运算。因而能提高入侵检测系统的效率。  相似文献   

19.
基于粗集理论的数据离散化技术研究   总被引:2,自引:0,他引:2  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义,它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号