首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
分析了当前信息检索多是建立在语词匹配基础上的搜索,索引库不断增大,搜索时间长等问题.通过对文本检索步骤和索引结构的研究表明,索引结构是决定文本检索效率的关键.提出对动态索引结构B+树进行改进,通过改进减少了索引层数,提高了检索速度,降低了索引存储空间,研究结果对改进文本检索效率具有积极意义.  相似文献   

2.
针对常规模式匹配方法在大规模模式匹配中效率不高无法满足在线应用的问题,提出了一种高效率用户查询模式匹配方法.该方法在常规模式匹配方法中引入查询模式语义环境,使用搜索技术和聚类技术裁减模式匹配的搜索空间,在保证正确率的前提下,能显著提高匹配效率,满足用户在线响应时间要求.实验证明了这种方法的有效性.  相似文献   

3.
模式匹配是获取不同模式间语义关联关系的技术,是数据集成过程中的关键操作.随着可检索在线数据库数量的迅速增加,大规模的模式匹配工作的需要使多源模式匹配方法成为模式匹配领域研究的重点.针对现有多源模式匹配方法的缺陷,本文提出了一种基于素数的多源模式匹配方法,并提出了具体算法-PMSM.该方法将素数理论引入模式匹配过程中,使单纯的字符匹配转换为素数计算,提高了匹配效率,同时保留了现有多源模式匹配方法的优点.实验证明,PMSM切实可行.  相似文献   

4.
针对高校校园这一应用领域,设计并实现了一种基于多层策略的校园问答系统.提出了校园知识的3种类型,即服务型知识、常见问题型知识及文本检索型知识.针对不同类型的知识,建立了特定服务查询、常见问题查询和自由文本检索多级策略的问答系统模型,逐级匹配查询问句的答案:特定服务查询通过模式匹配将问句转换为服务接口;常见问题查询通过特征关键词提取、问题分类和问句相似度计算算法将问句与常见问题库中的问题-答案对匹配;自由文本检索对全文检索引擎solr返回的候选文档进行答案抽取,获取答案段落.性能测试表明:对80%以上的查询问句,若问题相关知识存在于系统中,则系统都能给出满意的答案.  相似文献   

5.
基于二维模式匹配的图像检索快速算法   总被引:1,自引:0,他引:1  
图像检索快速算法是基于内容检索研究的重要内容 .首先推广改进了已有文本二维模式匹配快速算法 ,然后将该算法应用于图像内容的检索过程中 ,并实验研究了精确匹配和近似匹配图像检索快速算法的有效性  相似文献   

6.
针对视频图像的运动估计问题,提出了一种无回溯搜索的快速块匹配算法.算法基于快速模式匹配KMP算法思想,将图像中的块匹配转化为一个一维的串模式匹配.利用子块的自匹配特性,计算子块中每一个像素的next值.当模式中第j个像素与主块中的像素"失配"时,从子块的next数组中找到第r个像素继续比较,不需要回溯到开始匹配的位置.对具有不同复杂运动的视频图像进行实验,结果表明:在搜索窗口大小为(-12,-12)×(12,12)的区域内,与六边形搜索算法相比,在运算速度相同的条件下,本算法可大幅度提高运动估计的精度.  相似文献   

7.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

8.
一种新的多模式快速匹配算法   总被引:1,自引:0,他引:1  
提出了一种针对多模式的快速模式匹配算法.算法分为预处理阶段和匹配阶段两个部分,预处理阶段对所有待匹配的模式进行分析,构造一个关于这些模式的树型有限状态自动机,匹配阶段利用这个模式自动机,对文本串进行一次性的搜索,查找文本是否包含模式集中的模式.为了提高了匹配速度,算法利用已匹配的字符串信息实行跳跃式的比较,避免了文本扫描指针的回溯.  相似文献   

9.
字符串的模式匹配应用十分广泛,在信息的搜索查询等方面具有重要作用,研究串匹配算法的效率具有重要的理论价值和实际意义。在分析几种经典模式匹配算法的基础上,对当前应用最广泛的Sunday算法提出了改进的算法Zhusunday.算法主要改进之处是:在字符串从右向左匹配过程中,当文本字符中出现不匹配模式字符串的字符且该文本字符不是坏字符时,算法从右向左搜索当前文本字符在模式串中出现的位置;找到当前字符在模式串中的位置后继续再向左匹配模式串字符一次,如果仍不匹配时,模式窗口比Sunday算法多向右移动一个字符。改进的算法提高了模式匹配的执行效率,通过大量对比实验证明了该算法的有效性。最后得出结论:在实际应用中,坏字符大量存在的情况下,改进算法的最优时间复杂度可达O(n/m),在同一时间复杂度下,比Sunday算法效率提高25~50%.  相似文献   

10.
针对基于内容的人体运动检索问题,提出了一种基于逻辑相似性的运动数据检索方法。首先,针对特定人体运动序列数据,使用自组织网络映射算法对运动数据进行预处理,找出运动数据帧的最佳匹配单元。然后,应用数据编码规则对匹配单元进行量化及编码处理,获得基于符号化表示的运动描述符。基于符号化表示的描述符建立运动序列索引机制,应用多分辨率框架进行运动模式匹配。最后,按照模式匹配结果进行运动相似性排序,输出检索结果。在CMU运动数据库中的试验结果表明了算法有效性。  相似文献   

11.
在动目标的搜索过程中,搜索者在有限的时间内,利用有限的资源寻找目标,使其期望回报最大,而目标则针对搜索者可能采取的策略,选择适当的运动路径躲避搜索者的搜索。将此问题归结为一个二人零和对策问题,并给出利用对策论求解的方法。  相似文献   

12.
试述科技查新中专利文献的检索   总被引:1,自引:0,他引:1  
阐述了科技查新中专利检索的重要性,分析了专利检索中选择检索工具、检索方法和检索策略等几个问题,为科技查新人员快速掌握专利文献的检索提供有益的帮助。  相似文献   

13.
多元搜索引擎能够有效利用多个搜索引擎的搜索与集成资源能力.文章首先分析了现有多元搜索引擎的局限性,然后提出并发多元搜索引擎的改进方案,阐述了并发多元搜索引擎的结构、关键技术,以及在外文电子资源统一检索平台系统中的应用.该引擎实现了高效的查询请求分发与结果处理,具有较好的并发处理能力和效率.  相似文献   

14.
本文讨论了顺序文件的树形分叉查询法与分块分叉查询法的最大查询次数和平均查询次数。给出了分块分叉查询法的最大查询次数和平均查询次数为极小值时的条件。  相似文献   

15.
提出了一种低复杂度、低硬件开销的多径搜索器结构.利用扰码匹配滤波器和峰值检测方法完成初步的多径搜索;引入一种假径搜索方法来代替非相干多帧平均的方法,提高了多径搜索的正确性,同时避免了采用大量存储单元.仿真结果表明:在给定的瑞利多径衰落信道条件和信号能量比条件下,该多径搜索器可以将搜索错误率保持在15%以下,较2帧的非相干多径搜索器,错误率减小5%,同时面积减少31.19%;较4帧的非相干多径搜索器,错误率减小1%,同时面积减少58.42%.  相似文献   

16.
中国搜索引擎服务市场的现状及发展   总被引:7,自引:0,他引:7  
针对当前我国的搜索引擎服务市场分析该市场的规模、商业模式及发展前景,并从加强技术创新,提高服务质量,实现服务的垂直化和个性发展方面进行了探讨。  相似文献   

17.
云上外包数据库的安全问题已成为云计算安全的研究热点。给出两个具有数据保密性的云上外包数据库模型,可以验证查询完整性,并能有效保护数据搜索者的搜索隐私。这两个数据库模型支持单属性等值选择操作及其与投影的复合操作,支持数据的添加与删除。与已有的此类方案相比,在计算量相当的前提下,具有较高的安全性和较多的功能。  相似文献   

18.
搜索引擎Google的体系结构及其核心技术研究   总被引:2,自引:0,他引:2  
Google采用了并行,索引桶,数据压缩,PageRank算法等的技术,建立了复杂的体系结构,包括网络爬行机器人crawler、知识库Repository、索引系统(包括索引器indexer,桶barrels,文件索引等)、排序器Sorter和搜索器Searcher五个部分.Google的rank系统综合了词频,类型,相邻度,网页重要性等因素.其中最值得一提的是计算网页重要性的PageRank算法,它把文献检索的引用理论应用到Web中,即一个网页有很多网页指向它,或者一些重要的网页指向它,则这个网页很重要.PageRank算法大大提高了检索效率.  相似文献   

19.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

20.
This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号