首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
基于可扩展标记语言的桥梁抗震设计文档构建   总被引:1,自引:0,他引:1  
为了提高桥梁抗震设计文档的生成效率,结合可扩展标记语言适宜文档处理的特点,以同济大学土木工程防灾国家重点实验室完成的桥梁抗震设计文档为基础,设计了一个通用的桥梁抗震设计文档模板,开发了桥梁抗震设计文档生成系统.系统包含存储子系统和功能子系统两部分,前者由可扩展标记语言模板库、摘录编码库、工程数据库、设计规范库、专家经验库组成,后者由文档分类、文档集成和格式转换组成.系统可以自动生成桥梁抗震设计文档,其有效性通过实例得到了验证.  相似文献   

2.
XML数据由嵌套的标记元素组成,标记包含了对文档存储形式和逻辑的描述XML的嵌套标记使得它更适合描述Web上的半结构化的数据。XML不仅能够表示文档的内容,而且可以表示文档的结构。通常解析XML文档有两种方法:一种是文档对象模型DOM(Document Object Model),另外一种是XML简单接口SAX(Simple APIfor XML)。本文对这两种方法进行了介绍,并在VC6环境下实现了对XML文档的解析。  相似文献   

3.
基于简化脉冲耦合神经网络(SPCNN),提出一种有效的文档图像脉冲噪声去除方法。首先通过测试模拟文档图像说明SPCNN检测文档图像噪声的可行性,然后设计SPCNN检测算法判断出噪声像素并加以标记,只对标记为噪声的像素做滤波处理。从仿真实验可以看出,本文方法具有较好的视觉效果,计算结果表明该方法比一般去噪方法明显改善。  相似文献   

4.
提出一种基于XML的文档图像在原生数据库中存储和检索的新方法,该方法将文档图像切分标记为XML文档,将此类XML文档存储到原生数据库中;利用XML:DB API接口对XML数据进行查询和管理,XSL样式表完成XML数据的显示.  相似文献   

5.
文章介绍了网页标记语言HTML的概念、书写规则、文档结构及其在网页中的应用。  相似文献   

6.
数字图书馆的建设面临着资源整理、查找、存储等一系列问题,传统的文档存储形式不利于信息的再利用、web发布等。提出了将中文文本数据转换为可扩展标记语言(XML)文档的一种方法,通过解析一个文件类型表示(DTD),利用DTD中给的元素名称、属性等从文本数据中找到相应元素的内容,从而形成一个特定DTD下的XML文档。  相似文献   

7.
当前流行的Web查询技术是基于关键词匹配的信息检索,它已不适应用户提出的解决复杂文档、结构和半结构查询的需要.文章在系统介绍了标记语言和可扩展标记语言的基础上,分析了基于可扩展标记语言的数据模型、存储、查询和查询优化方法.  相似文献   

8.
利用XML文档中各路径之间相似的特点,只扫描一次XML文档,把重复的XML标记所生成的事件组合成一个聚合事件,并在基于共享前缀的NFA算法YFilter基础上,提出一种改进算法PolYFilter,实现了聚合事件的谓词计算.实验表明,与YFilter相比,PolYFilter算法减少了大量相同的有限自动机状态转移的中间状态,避免了状态集的重复计算.特别是当XML文档比较大,且重复标记比较多的时候,PolYFilter有较好的过滤性能.  相似文献   

9.
XML文档中相当大的部分由标记组成,用起始和结束元素标识符描述文档的树结构.本文重点研究了XML文档树结构的压缩算法,比较了各种编码方法与树结构中包含的节点数目和模型规模之间的关系.提出了有效的XML树结构压缩算法,实验结果表明,这种算法对于内部片段多次重复出现的XML树结构特别有效.  相似文献   

10.
基于DOM的XML文档支持系统   总被引:11,自引:0,他引:11  
作为SGML的子集,元标记语言XML及其相关技术正得到越来越广泛的应用,文档对象模型是一种平台无关、语言无关的标准接口,是XML、HTML、文档互操作的基础,首先论述了XML的应用前景和应用现状,然后提出了基于DOM的XML文档支持系统,系统为用户提供一套组件,用来完成XML文档的生成、表现、文档转换等工作,系统同时提供DOM1.0所定义的对外功能接口以支持Web的互操作。  相似文献   

11.
XPath是有关如何在XML文档中进行定位,即如何很快找出XML文档中具有某种特征标记的一种语言.XQuery、XML Schema等语言都需要通过XPath表达式来对XML文档进行定位、绑定变量、引用外部文档元素等等.所有这些应用都需要解决XPath表达式的包含问题以提高匹配效率.引入了条件同态的概念,提出了一种基于条件同态的包含关系的判定算法,该算法能够正确判定现有的实用算法不能正确处理的一类模式树的包含关系.  相似文献   

12.
XML(Extensible Markup Language),即可扩展标记语言。为保证文档的有效性,任何应用程序在执行关于XML数据的计算和转换之前,必须对XML文档进行验证。在完成对待验证的XML文档的封闭性检测之后,对XML文档和其相对应的Schema文档的数据结构进行检测,判断一下它们的树结构是否完全同构。再利用DOM技术读取Schema文档树和XML文档树的各节点,判断XML文档树各节点是否符合与之相对应的Schema文档各节点所定义的规则。具体来说,包括:类型定义部件,组部件,属性组部件。该系统可以顺利地检测待验证的XML文档,基于Schema文档规则,在满足封闭性和同构性的前提下,可以判断并指出XML文档的错误信息,并对其进行定位。  相似文献   

13.
杨乐  王群 《科技信息》2012,(33):65+81-65,81
可扩展标记语言(XML)已经快速发展为Web上数据表示、集成和交换的标准。Intemet上越来越多的数据表示为XML文档,但是,当今大多数商业数据还是存储和管理于关系数据库中。这就需要为Intemet的应用程序将关系数据高效准确的转换发布为XML数据。本文阐述XML与关系数据库的映射方法,并介绍了XML文档与数据库之间的具体转换。  相似文献   

14.
一种新的代理缓存替换算法   总被引:1,自引:0,他引:1  
使用文档大小、访问频率、文档访问剩余寿命作为计算文档价值的关键词,在提出的替换策略上,对文档的访问频率作一个更精确的计算。实验结果将会表明该算法的改进更进一步提高了缓存性能,得到较高的文档命中率和文档字节命中率。  相似文献   

15.
为了能在多文档自动摘要过程中更好地划分子主题,提出了一种基于半监督学习的子主题划分方法:首先计算句子的语义相似度;然后通过层次聚类对可信度高的句子进行主题类别标记,生成少量已标记主题类别的句子集,在此基础上对所有句子进行constrained-k-means聚类,通过交叉验证的方法确定子主题的数目k;最后使用k-means聚类获得多文档的各个子主题.实验结果表明,该方法有效地提高了子主题的识别率.  相似文献   

16.
基于XML安全的加密数据库中的数据交换   总被引:2,自引:0,他引:2  
随着Intemet技术的迅速发展,数据库中敏感数据的安全性问题也随之引起人们的重视.该文基于XML加密的思想,给出了一套传递加密数据库中的密文及其相关解密信息的标记,并且设计了加密数据库和XML文档之间的映射规则,最后给出了一个基于XML的加密数据库的数据交换模型。  相似文献   

17.
在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用HTML结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的方法,并通过使用TREC-9的查询做实验,比较了分段检索方法和传统的文档检索方法的检索质量.实验结果显示,在多主题文档集上分段检索方法比文档检索方法的11点平均准确率提高了大约9%,而在所有文档集上分段检索比文档检索提高了大约1.6%.分析发现,分段检索方法可以明显改善结果的排序,而且实际检索质量提高的幅度比现有的评价结果显示的更显著.  相似文献   

18.
基于数学形态学的文档图像段落标记及其应用   总被引:1,自引:0,他引:1  
随着信息采集技术的发展,文档图像在信息的数字化管理中越来越重要,针对文档图像,本文就文字段落的智能识别进行了研究,给出了段落特征点检测的算法,最后给出了段落检测的一个实际应用.实验表明,本文提出的算法可以有效对段落的特征点进行标记,且具有很强的鲁棒性.  相似文献   

19.
XML元数据在信息资源规划系统中的应用   总被引:1,自引:0,他引:1  
信息资源规划是建立一个企业或组织的业务模型,并在业务模型的基础上抽取系统的数据模型和功能模型的过程.对信息资源规划工作进行了描述,并利用XML(可扩展标记语言)元数据定义规划过程中所需交互的文档,在此基础上建立了一个信息资源规划系统的模型,使信息资源规划工作有序化,自动化。  相似文献   

20.
扭曲的文档图像会干扰文档图像的光学字符识别(Optical Character Recognition,OCR).为了对扭曲形变的文档图像进行矫正,提高扭曲文档识别的正确率,基于目标检测与分割的网络,提出文档图像的边缘检测方法,使用贝塞尔(Bezier)曲线拟合文档图像的边缘曲线,通过目标检测的算法回归Bezier曲线的控制点.将文档图像的边缘检测转化为边缘曲线Bezier控制点的回归,使用文档的边缘点计算扭曲文档矫正后的矩形模板,然后将文档图像通过薄板样条插值(Thin Plate Spline,TPS)算法重映射到矩形模板中,完成文档的矫正.实验结果表明,提出的矫正方法能够对扭曲文档进行精确的边缘提取,和其他算法相比,经该算法矫正后的文档图像,其OCR的正确率有较大的提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号