首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 671 毫秒
1.
针对高校信息化建设中最重要的高校图书馆信息网络建设,分析元数据格式和跨库检索模型,选定DC(Dublin Core)作为元数据格式,建立它和不同数据表之间的属性映射关系,并通过元数据临时表进行数据结果的统一查询,看重介绍了基于JSP开发的数字图书馆著录与统一检索系统,从而有效地提高高校图书馆信息网络的管理水平和安全稳定性.  相似文献   

2.
一种基于文本节点的XML文档索引   总被引:1,自引:0,他引:1  
XML将逐步取代HTML成为Internet上的主流数据表示及数据交换格式,如何快速准确地对XML文档中的数据进行查询也成为亟待解决的关键问题.因此,需要开发一种适合XML的查询策略以及特殊的索引技术.文章利用一种基于文本节点的XML索引TN—Index,特点是索引文件规模较小,而且可以进行局部查找,这样就实现了XML文档的快速查询.  相似文献   

3.
适用于P2P的系统查询扩展优化方法   总被引:4,自引:0,他引:4  
P2P系统中,各种文本文档是很重要的共享资源,而传统的信息检索技术无法在此复杂系统中获得良好的效果.通过对隐含语义索引的分析,提出了语义双重查询扩展(SDQE)的方法,它利用各个peer上文档集提供的隐式反馈,通过比较查询的上下文信息,发现用户的隐含偏好,从而找出最符合用户查询需求的文档.实验证明,SDQE是可行的,并能有效地提高P2P系统中文本检索性能.  相似文献   

4.
在研究OGSA-DAI的基础上,提出一种基于虚拟数据视图的分布异构数据访问与集成框架.系统由元数据服务和网格虚拟数据库服务构成,其中元数据服务负责发现含有用户所需数据的数据库,网格虚拟数据库服务提供全局逻辑视图,通过分布式查询机制将用户的SQL请求分解到具体的数据库中并进行结果合并,实现数据的透明访问和联合查询.  相似文献   

5.
根据GML数据查询的需要,在分析XML文档编码和空间索引技术的基础上,提出一种基于扩展的元素区间编码的GML索引方法.首先通过扩展的区间编码方法对GML文档中的元素、属性、文本、几何体等要素进行编码;其次依据元素编码算法并将非空间节点、空间节点、元素节点从GML文档树中分离,产生元素编码序列;在此基础上根据节点类型的不同对属性和文本节点建立B+树索引以实现值查询,对几何体节点建立R树索引以实现空间数据的分析操作,并在查询处理时通过查询优化算法避免不必要的节点的遍历,进一步提高查询效率.实验结果表明,基于元素区间编码的GML数据索引方法是可行的、高效的.  相似文献   

6.
提出了结合HTML抽取和OAI—MPH收获这两种方法的元数据自动获取系统,前者用于从HTML文档首部中提取出相应的元数据;后者则从远程元数据数字仓储中按照标准的元数据交换协议收获所需的元数据.  相似文献   

7.
在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该文提出了一种整合用户查询行为与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态调整索引库关键词权重,从而提高信息检索的查全率和查准率.  相似文献   

8.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

9.
基于本体的信息检索系统模型   总被引:5,自引:0,他引:5  
针对基于关键字的传统查询方法存在的不足,提出一种面向语义查询的信息检索模型.该模型将信息检索方法与语义Web技术相结合,通过基于本体的知识库实现用户对文档库的语义查询;同时,综合考虑语义检索和关键字检索两种情况,提出一种相似度计算方法,有效地满足了用户对Web信息资源的要求,并为以后的语义检索研究奠定了理论基础.  相似文献   

10.
基于Markov网络的检索模型   总被引:2,自引:0,他引:2  
基于Markov网络的信息检索模型提出一种贝叶斯网络推广的检索模型,该模型利用词项在文档集中的共现信息来构造Markov网络,通过该索引项子Markov网络来加载附加查询证据源,计算文档与查询之间的相关性概率,由此概率进行文档排序. 实验结果表明,本文提出的Markov网络模型比其他传统的检索方法具有更优的检索性能.  相似文献   

11.
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。  相似文献   

12.
提出一种支持多语言的分词算法,该算法可以按照以下层次来理解:首先,对不同编码的源词库文件编码转换,生成Unicode编码的源词库文件;然后,用Unicode编码的词库文件生成Unicode词库索引;最后,将待分词的自然语句转换成Unicode编码的语句并按照索引倒序分词。该算法已经用C++语言实现,基于此算法实现的分析系统能够自动探测词库的更新并确定是否需要更新索引,能够支持多种编码方式,其编码转换和分词代码与平台无关,分词效率在9MB/s以上,正确率在90%以上。  相似文献   

13.
0 IntroductionTIon tceorpneet w ,itthhefr cerqauwelnetr sch oafn sgeeasr cohf tehneg iinnfeo rnemeadti toon uopnd tahteethe web pages visited. Different pages have different changefrequencies[1].Sothe crawlers must firstly esti mate which pa-ges need to b…  相似文献   

14.
为了弥补互联网信息爆炸带来的搜索引擎用户满意度低的问题,提出了一种基于本体的垂直搜索引擎模型。该模型构建一个本体知识树,利用增加了属性提取和相似度算法的NWeb-Crawler对网页进行抓取,并将非相关信息进行隔离;然后,进行网页源代码格式信息和语义信息两方面的抽取;抽取的数据信息通过分词后建立二维索引表,用户的请求通过本体知识树扩展概念集和二维索引表进行检索。该系统模型从入口网页到出口数据逐步贴近检索需求,具有良好的扩展性,对垂直搜索引擎的研究有一定的参考借鉴作用。  相似文献   

15.
特征词提取是一项提炼整个web页面内容的实用技术,同时也为文本分类,信息抽取应用提供了技术支持.在web页面内容上,利用段落间语义关系划分出网页内容的篇章结构,并以此为基础使用网页的元数据和特殊标签,设计了一个特征词的加权函数,综合考虑了词频、词长和位置因子,最后,实验对比了各类位置因子对系统的贡献度.实验结果表明,改进方法的F1值比传统的TFIDF提取技术提高了15.5%,其中,位置因子中的标题,关键词和摘要因素对系统的贡献最大.  相似文献   

16.
Current Application of Search Engines and Their Developing Trend   总被引:2,自引:0,他引:2  
IntroductionWorldWideWebisoneofthemainservicesonInternet.In1991,thefirstWebsoftwareisworkedoutinordertoaffordasharedtoolofachievementandgroupinformationforitsphysicistsinCERNinSweden .Fromthenon ,thewebtechnologyanditsapplicationsareexpandingatanamazingsp…  相似文献   

17.
本设计并实现了一个基于内容信息过滤的智能Agent:CuteSeareher.它能够根据用户提交的示例档,采用机器学习的方法对用户的兴趣进行建模.并通过与www上的搜索引擎相互作用,自动查找用户所需的信息.在两个方面解决了现有过滤系统在学习方法方面的不足:第一,采用了概念推理网解决词组分割问题;第二,使用基于协同演化的遗传算法解决档的特征抽取问题.测试表明它可以有效地帮助用户在www上搜索信息.  相似文献   

18.
地学数据共享网络中的元数据扩展和互操作技术   总被引:5,自引:0,他引:5  
利用元数据技术整合分散的数据资源,并借助网络提供共享服务已成为当前数据交换中心的主导模式.这一模式隐含了3个潜在的缺陷,元数据的可扩展性和互操作性是其在数据共享网络中应用的关键.针对地学数据共享网络,建立了元数据的扩展模式,并依此构建多学科元数据扩展体系;分5个方面分析了元数据互操作技术(核心元数据互操作、元数据映射、RDF技术框架、基于协议层的互操作和Web Service互操作).结合元数据分布查询服务(SRW)介绍了基于ZING标准的元数据互操作的开发应用实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号