首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   9篇
  免费   0篇
  国内免费   1篇
综合类   10篇
  2012年   1篇
  2010年   1篇
  2009年   4篇
  2008年   1篇
  2007年   1篇
  2005年   1篇
  2001年   1篇
排序方式: 共有10条查询结果,搜索用时 15 毫秒
1
1.
基于源网页的信息比目标网页的更具有区别性,提出通过提取源网页扩展的锚文本,进行目标网页特征识别。分析了不同位置的扩展锚文本,获取其XPath表达式,用于提取网页特征,并通过实验分析其性能。  相似文献   
2.
针对广告抽取系统的实际需求,该文提出了利用XPath规则从包含多个广告的页面中抽取广告记录数据的方法.该文主要阐述了广告抽取系统核心模块的实现机制和系统架构.实验结果表明,该方法能够准确定位页面广告数据块,并且能较好提取块内广告记录信息,具有一定的实用价值.  相似文献   
3.
在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析成文档对象模型,根据用户需求建立抽取规则,采用自动生成模板机制,并依据模板的抽取规则对网页信息进行抽取.实验证明,该抽取方法具有较高的召回率和准确率.  相似文献   
4.
针对密集型数据查询要消耗大量内存的缺陷,设计了一种基于流的XM L文档查询算法.该算法在对XM L流的一次单向读取过程中处理XPath,接收查询表达式,将表达式转换为树形自动机,自动机以流的方式接收并处理XM L文档,同时输出当前处理结果.在查询树状态转换过程中附加了缓存操作,用于保存XM L流中暂时无法判断的文档片段.算法测试表明其占用内存空间基本恒定,不会随被查询文档的增大而增加.  相似文献   
5.
武凤翔  张会娟 《河南科学》2010,28(8):1011-1014
对自动机理论及XPath查询技术进行了分析,提出了一个基于交错自动机的新模型,理论分析表明,该模型可以有效地提高XPath表达式谓词处理的效率.  相似文献   
6.
针对XML技术飞速发展,其数据呈爆发式增长,相应地对XML数据的存储成为该技术发展的重要环节等问题,本文旨在设计一个为3G数字移动通信附加服务而服务的XCAP服务器,该服务器使得用户能在客户端通过XCAP协议对以XML格式存储于XCAP Server上的3G附加服务配置个性化文件,正确响应客户端对XCAP服务器上的XML格式的个性化配置文档进行相关操作(Get,Put,Delete)的请求,实现XCAP服务器能够对用户提出的对3G移动通信所提供的附加服务.  相似文献   
7.
提出了在XML数据流上有效评测XPath订阅的技术和方法。根据XPath层次结构的语义特征, 设计了基于非确定有限状态自动机的动态索引结构, 使得具有相同前缀的XPath查询可以共享存储索引的空间和共享查找索引的计算。基于栈的新评测算法设计了高速缓存软件预取技术, 以处理评测过程中频繁出现的cache缺项问题。系统取得了很高的性能, 通过全面的实验表明, 系统可以有效处理超过百万以上XPath查询的负载量。  相似文献   
8.
异构数据源间的数据共享是数据库研究的热点和难点.分析了当前信息发布技术的局限,以及现阶段应用XSLT、XPath和DOM查询XML数据的可行性;提出了一个应用模型,并用一个实例说明编程方法;介绍了使用XSLT技术来解决数据转换问题,使用Java将其封装为中间件.该中间件可以方便地移植到需要数据转换的软件系统中,解决了软件产品中关系型数据间的数据共享问题.  相似文献   
9.
网络环境下XML数据库查询应用,目前国内外已存在多种优化技术,查询重写,语义缓存等,但在冗余去除方面却缺乏研究。在已有技术的基础上,从减少网络流量的角度改进原XPath查询集冗余去除方案,利用XPath树模式和DTD对查询集在不同XML文档结构下冗余度进行评估,并在算法中权衡网络流量和XPath查询复杂度,来满足用户需求。  相似文献   
10.
XML语言及其扩展为Web提供全新的信息表示与处理技术   总被引:1,自引:0,他引:1  
本文对当今正在兴起的一种新的可扩展标记语言XML作了概述,在此基础上,结合实例讨论了与 XML相关的扩展语言的功能,包括名域、查询和链接、XML Schema、可扩展样式表语言(SXL)等,最后说明了与XML有关的开发活动。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号