首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
一种基于XML的WebGIS多源异构数据集成方案   总被引:1,自引:0,他引:1  
本文提出了一种基于XML的WebGIS多源异构数据集成方案,在该方案中,既可对不同数据源上载到空间数据库,也可将不同数据源进行模式映射和转换而存储为XML数据库.对于空间数据库,调用GIS应用服务器上的Web Service对其进行数据抽取并转换为XML格式;对于XML数据库,则直接通过封装了XML查询的Web Service进行数据抽取;最终使异构空间数据集成于XML这一文本格式.同时,还可通过对已定义的Web Service进行发布和注册实现本系统GIS数据库服务器上数据资源的共享,也可以通过搜索Internet上已发布和注册的相关Web Service,通过对其引用而实现异地数据的集成,由此实现空间数据之间的共享与互操作,实现多源异构的地理空间数据的有机集成.最后通过XSLT将XML转换为SVG实现地理空间数据的可视化.  相似文献   

2.
为实现简捷的信息抽取和信息利用,提出一种采用树型结构实现Web数据到XML文档的转换算法.使用基于树型结构的类型定义和信息抽取方法,可有效将Web文档中的数据抽取出来并表示为XML格式的文档,形成可用的XML数据源,便于其他应用程序使用结果数据,为实现Web中的信息共享与数据交换提供便利条件.  相似文献   

3.
基于XML与Java凭借跨平台的优势及其互补性的特点,为下一代Web应用开发的基础数据描述格式与主要开发环境,针对Java处理XML数据的几种接口的缺陷,研究了通过XMLSchema到Java类的映射,实现基于数据绑定的Java应用对XML数据的操作,并用典型实例给予验证.该方法较SAX及DOM具有能够双向数据操作,对系统资源要求低的特点,特别适合XML文档表示配置信息的情况.  相似文献   

4.
余文芳  荆泽泉 《科技信息》2011,(27):I0073-I0074
本文设计了一个基于XML和Web Services的异构数据集成模型,该模型以XML技术为支撑,采用Web Services封装异构数据源,同时建立领域字典表及字段映射表,有效解决了多数据源环境下的异构数据集成问题。  相似文献   

5.
利用Java和XML在Lotus Domino Web环境中实现跨平台数据交互   总被引:4,自引:0,他引:4  
概括介绍了利用Java和XML在Lotus Domino Web环境中开发办公自动化系统的技术,并详细讨论了如何在Lotus Domino Web环境中利用Java和XML比实现生成、存储和转换XML比文档的方法.最后得出结论XML比和Java这两种跨平台技术相互配合、相互补充,必将为应用系统带来更大的灵活性.  相似文献   

6.
基于XML的异构数据源间数据交换的实现   总被引:1,自引:0,他引:1  
基于Web Service,XML设计开发了可配置的灵活数据交换集成中间件,阐述了数据集成中间件的关键难点部分的设计,如确定数据源、数据源数据和XML数据之间的映射、Select和Insert等命令的语法检查、转换规则的建立等.所开发的中间件在档案和办公系统的数据集成中得到了应用,很好地完成了对异构数据源数据的数据检索、交换、迁移以及数据更新的任务.  相似文献   

7.
Java和XML实现异构数据库环境下的数据抽取   总被引:1,自引:0,他引:1  
从Java、XML等方面入手,利用Java的跨平台特性和XML信息交流的标准平台特性,在数据挖掘和开发基于Web/Server的统一信息平台时,可便利地进行数据抽取工作,提出一个基于异构数据库环境数据抽取的系统结构  相似文献   

8.
Web数据挖掘是将数据挖掘技术和理论应用于对互联网资源挖掘的一门新兴研究领域.XML能够为web数据挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型.  相似文献   

9.
为解决当前可扩展标记语言(XML)绑定框架普遍存在的由XML模式映射生成的数据类的冗余,以及数据类系统规模过大的问题,提出一种从一组相关XML数据文件的数据实体类识别方法.该方法先抽取这一组XML数据文件的XML模式树图,并将其每个节点表示成向量空间中的向量;然后,利用相似度和距离识别该模式节点对应的预定义模式节点类型;最后,按模式节点类型到类的映射规则得到数据类.结果表明:该方法能识别合并对应同一个实体的数据类避免类冗余,将集合类型的XML文件映射成泛型类和集合类减小生成类系统的规模.  相似文献   

10.
Web数据存在方式的特殊性使Web数据控制变得十分复杂,把现有的Web页面转换成XML可以使那些熟悉Web最常用技术的开发人员能快速而便捷地获取他们所需的以Web方式发布的信息.描述了从目前存在的最大信息来源-万维网-抽取信息的方法和实现过程.  相似文献   

11.
通过对现有网页数据抽取方法的分析,结合专利网页数据的特点,提出了一种基于XML文件和规则库的专利数据抽取方法。通过自定义标签对网页进行格式化,克服了以往网页采集中只针对<\table>和<\div>标签进行分割提取数据的不足,实现了专利数据的有效采集。实验结果表明该方法具有很高的准确性和适用性。  相似文献   

12.
基于DOM树及行文本统计去噪的网页文本抽取技术   总被引:1,自引:0,他引:1  
首先对网页源码文本统一编码转为UTF格式,然后把HTML网页文档转换为XML文档并解析为一棵DOM树。依据XML语言特点及噪声特征规则先对DOM树的噪声节点进行过滤删除,然后依据中文标点符号统计方法提取网页正文内容,并在此基础上利用行文本统计方法去除提取出的正文中存在的噪声信息,最后得到网页正文文本。对来自结构完全不同的主流与非主流的中英文新闻网站上的2 000篇网页进行实验,结果表明本文提出的方法具有较高的抽取准确率,并具有很好的通用性和实现简单的特点,适用于针对互联网中不同网站新闻文本信息的自动采集。  相似文献   

13.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

14.
0 IntroductionTIon tceorpneet w ,itthhefr cerqauwelnetr sch oafn sgeeasr cohf tehneg iinnfeo rnemeadti toon uopnd tahteethe web pages visited. Different pages have different changefrequencies[1].Sothe crawlers must firstly esti mate which pa-ges need to b…  相似文献   

15.
The massive web-based information resources have led to an increasing demand for effective automatic retrieval of target information for web applications. This paper introduces a web-based data extraction tool that deploys various algorithms to locate, extract and filter tabular data from HTML pages and to transform them into new web-based representations. The tool has been applied in an aquaculture web application platform for extracting and generating aquatic product market information. Results prove that this tool is very effective in extracting the required data from web pages.  相似文献   

16.
通常搜索引擎网站都有存储大量远程站点复制网页的数据库.为保持复制网页和源网页的同步,需要花费大量的时间和资源.本文提出了保持复制网页和源网页一致的多种同步新策略,并提出源端网页变化的泊松模型,给出了刷新率和刷新时长的规范性描述,对各种同步策略的性能进行了研究和比较分析,发现其较大地改善了网页数据库刷新率.  相似文献   

17.
任雪冬  曲晶 《中国西部科技》2011,10(2):29-30,27
作为Web2.0时代最具代表性的技术AJAX即"Asynchronous JavaScript and XML"(异步JavaScript和XML),AJAX为传统Web应用程序带来了变革。AJAX揭开了无刷新更新页面时代的序幕,并有代替传统Web开发中采用表单递交方式更新Web网页的趋势。在引入AJAX关键技术的基础上,对传统Web应用与AJAX应用实现过程进行比较,结合技术实践分析了AJAX的优势和存在的缺陷。  相似文献   

18.
XML数据岛是网页设计中处理XML数据的新技术.介绍了XML数据岛的概念,讨论了Web页中XML数据绑定的原理和实现,并给出了基于XML数据岛和XML数据绑定技术在客户端实现各种数据操作的方法和代码.  相似文献   

19.
随着网络的迅猛发展,web服务已经成为研究的热点之一.本文介绍了一种文件类型网页文件的文本信息预处理技术.该方法能够解析网页文件的组成结构,并从中提取出主体文本以供处理.测试表明该方法能快速有效地得到大部分HTML网页的主体部分.  相似文献   

20.
为了使Web站点进一步适应当前复杂的电子商务,必须引入智能技术,通过融合XML信息交换、智能文档分析与搜索、数据库动态网页、数据仓库,虚拟现实和流式多媒体等技术,将能够建立起支持生动的个性化服务、智能搜索与信息推送、实时交互与协同工作、事务处理与决策支持、通用数据访问与数据挖掘等功能的智能站点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号