首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 127 毫秒
1.
针对大规模单语语料资源,提出了采用B-tree结构的二级索引机制;研究了索引及检索关键字的组织策略,引入了检索关键字的词频因素,通过关键字的分组及短语的识别策略,有效地解决了检索效率和准确率问题.  相似文献   

2.
本系统在中文资料数据库中,按资料标题提录四个辅关键字,并对其建立了倒排索引文件,对倒排索引文件又建立了二级索引文件,形成两级索引系统,从而节省了存贮空间,提高了检索速度。在本系统编程中,采用了c—dBASE—Ⅱ及C—BASICA联合使用技术,从而方便了倒排索引文件的建立。  相似文献   

3.
探讨了针对概率XML文档集中与内容相关的关键字检索结果的排序问题,针对概率XML文档的特征提出了一种新的排序模式.与仅取决于检索结果概率的检索排序算法不同,本文提出的排序算法充分考虑了节点对文档的区分程度、节点描述文档的程度,以及XML文档本身的结构特性,设计了满足以上特征的检索结果排序模型,并针对排序模型提出了新的倒排索引结构.新的排序算法可以快速完成关键字检索,并将最相关的信息提供给用户.模拟数据集实验验证了该方法的有效性.  相似文献   

4.
细粒度语义网检索   总被引:6,自引:0,他引:6  
语义网的有向标记图数据模型决定其在内容检索方面与纯文本、超文本或半结构化文档检索存在较大差异.现有检索模型和相似度计算方法不能完全满足对语义网的检索和评价.该文以资源这种较细粒度作为检索单元,考虑查询关键字在资源内容中的频率和结构分布,提出一个细粒度语义网检索模型,并扩展了相似度计算公式和倒排索引结构.在语义网挖掘系统(semantic web aiding rich miningsystem,SWARMS)中实现了该模型及相关算法.在SourceForge和DBLP两个测试集上的实验表明,该模型能够结合语义网结构查询与基于关键字的内容查询,在相同查全率下查准率是单独应用结构或内容查询的两倍左右.  相似文献   

5.
研究了基于图结构XML文档的关键字检索方法。根据图结构XML文档的结构特点,结合用户输入的关键字及其类型,建立了用户查询语义模型;定义了拥有完整语义信息的查询结果模型,并从层次结构上分析来定义结果的语义相关性排序方案;提出基于语义的双层索引结构。实验结果表明,算法具有较高的准确率和效率。  相似文献   

6.
为了解决无线广播环境下空间关键字查询的问题,研究广播环境下空间关键字k近邻查询处理(BkSKQ),设计了一种结合kd树、倒排位图和(1,m)索引机制的空间关键字索引(ISKW)结构,以有效地组织对象的关键字信息、位置信息以及索引信息.该索引结构为客户的查询处理提供有效的指导,使得他们尽可能只下载查询处理所必须的数据信息.在ISKW索引结构的基础上,提出了BkSKQ查询处理算法.最后,通过模拟实验验证了提出的索引结构和算法的性能,实验结果表明所提出方法在访问时间和调谐时间上明显优于基于IR树的方法(BIRM).  相似文献   

7.
混合区块链通过链上-链下的存储模式来支持供应链中多方协同的数据可信共享.针对现有时空关键字查询方法预先读取全部链下数据并采用B+树作为索引所导致的效率低下问题,提出一种混合存储区块链中的时空关键字查询方法.首先,设计按属性划分的区块链存储模型,并在区块内和区块间设计B2M-BKM两级索引结构,支持关系型查询的同时高效检索区块数据;其次,设计链上-链下时空关键字查询方法,提升查询效率.最后,在公开数据集上进行实验,验证所提出方法的有效性.  相似文献   

8.
关键字是数据库设计的一个重要部分,它们是数据模型和概念设计的基础。关键字对索引、XML数据的存档以及设计关系存储都是非常重要的。本文主要提出了XML文档关键字的定义,包括绝对关键字、相对关键字以及强关键字的概念,同时给出了关键字的推理规则。  相似文献   

9.
在分析美国《化学文摘》中的各种索引及使用方法的基础上,制定出了符合个性需求的检索策略。  相似文献   

10.
研究了Data Cube的索引技术,提出一种能够处理复杂维层次结构情况的维层次编码.维层次编码充分利用了Data Cube中维的层次性及其语义特性,结合二进制编码与维层次结构编码对维成员值进行编码,通过二进制操作,可以快速检索出与查询关键字相匹配的维层次编码.同时,基于维层次编码定义的层次链掩码,层次掩码及检索函数能够充分利用多维数据中的语义信息,实现基于语义的检索,减少了I/O开销,提高了OLAP查询效率.  相似文献   

11.
科技查新中专利检索式的构建   总被引:3,自引:0,他引:3  
专利文献的检索是科技查新的重要内容,而检索式的构建是专利文献检索的基础。从确定关键词、确定国际专利分类号(IPC)、组织检索式几个方面,配以示例,详细分析了构建专利检索式的简便方法,为科技查新人员和专利检索人员提供参考。  相似文献   

12.
分析了当前信息检索多是建立在语词匹配基础上的搜索,索引库不断增大,搜索时间长等问题.通过对文本检索步骤和索引结构的研究表明,索引结构是决定文本检索效率的关键.提出对动态索引结构B+树进行改进,通过改进减少了索引层数,提高了检索速度,降低了索引存储空间,研究结果对改进文本检索效率具有积极意义.  相似文献   

13.
法律信息检索是从事法学研究和其他相关法律工作的前提和基础,因此,为法律工作者提供便捷的检索渠道一直是资料管理者和文献学研究人员的重要职责,其中法律信息资源和法律信息检索方法的梳理和介绍至关重要。法律信息检索的步骤主要包括确定检索词、选取检索工具以及分析评价检索结果等几个阶段,只有熟练掌握检索的步骤和技巧,才能在浩如烟海的信息资源中查找到用户需要的法律信息。  相似文献   

14.
音频数据检索技术的研究   总被引:1,自引:0,他引:1  
分析并提出基于音频流的多媒体数据检索方法和关键技术,在此基础上提出软件实现的框架:自动从Web中引出各种包含音频流的多媒体数据并为其中的音频流建立索引;通过音频流索引,在Web中实现基于例子和关键词缩放搜索能力的多媒体数据的检索。  相似文献   

15.
信息检索是科研工作中必不可少的工作之一。对科研工作中如何进行信息检索进行了探讨,包括分析检索课题、选择检索系统和数据库、确定检索词、编写检索提问式、实施检索并调整检索策略直至获取检索结果。  相似文献   

16.
为了提高专业领域内信息检索的查准率,使检索结果在语义层面能够重新进行排序以去除非相关条目,利用语义Web中的本体技术和本体标准描述语言OWL建立了证券领域本体,并且基于证券领域本体提出了面向专业领域的信息资源检索系统IRS—SA,该系统有助于机构或者个人投资者获得及时有效的证券信息.系统接受输入检索关键词从而利用查询转化器自动构造或扩展用户查询,将自然语言查询转化为系统内部的格式后,使检索获得的结果按照本体中定义的概念及关系进行语义再排序,并将最后所得结果返回给用户,提高了文档语义相关性程度.  相似文献   

17.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

18.
在MIS的设计中,智能技术的使用是一大趋势,本文的研究背景是MIS,检索操作围绕关键词进行,其工作有三部分:第一部分提出文献基本组织方法和映射式检索算法;第二部分提出近似分类算法和近似评判方法;第三部分提出容错近似检索算法(即允许用户)给出的待检索关键词有一个字的错误)、同音近似检索算法(以解决给出的关键词中音同字不同而造成的检索失败)和近似检索的词义辅助分析(这种方法有更大的容错能力)。  相似文献   

19.
以国际上较先进的引文珠形增长策略、积木型概念组面策略和逐次分馏策略为例,采用案例分析的方法,探讨优化信息检索策略的方法。在检索课题分析的基础上,对概念组面的取舍、检索词的选择,提供了多种思路和方法;各检索策略的合理运用,均可以达到较好的检索效果。  相似文献   

20.
在专利检索中较多使用的是关键词检索和分类号检索,但这两种检索策略在专利检索中各有优缺点。采用案例分析的方法,探讨了专利检索中新的检索方法——分类号与关键词相结合的检索方法,以此优化专利检索策略,达到较为理想的检索效果。关键词:专利检索;检索策略;关键词;分类号  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号