首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

2.
基于快速聚类索引的图像检索系统   总被引:5,自引:0,他引:5  
为了提高基于内容的图像检索系统的检索速度,提出了一个基于快速聚类索引的图像检索算法,并将其应用于视频新闻检索系统中.该算法采用Fastmap算法实现图像高维特征向量降维,并用改进后的模糊C均值聚类算法对降维后的图像进行聚类,生成图像索引.该算法用于图像检索,检索时间不会随着图像数据库中图像数量、特征向量维数的增加而增加,极大地提高了系统的检索效率,有效地解决了聚类中心初试值的选取问题.同时利用该算法构成的系统还具有动态删除、分裂、合并、插入等功能.实验结果表明,与顺序扫描算法相比,该系统不仅大大提高了检索速度,而且在图像数目和特征向量空间维数增大的条件下,仍能够获得良好的检索性能.  相似文献   

3.
为了弥补互联网信息爆炸带来的搜索引擎用户满意度低的问题,提出了一种基于本体的垂直搜索引擎模型。该模型构建一个本体知识树,利用增加了属性提取和相似度算法的NWeb-Crawler对网页进行抓取,并将非相关信息进行隔离;然后,进行网页源代码格式信息和语义信息两方面的抽取;抽取的数据信息通过分词后建立二维索引表,用户的请求通过本体知识树扩展概念集和二维索引表进行检索。该系统模型从入口网页到出口数据逐步贴近检索需求,具有良好的扩展性,对垂直搜索引擎的研究有一定的参考借鉴作用。  相似文献   

4.
 空间聚类和空间索引的结合是当前空间数据库中提高数据检索效率的技术之一。本文从空间聚类和空间索引的存储原理入手,阐述了K-Means聚类算法及其改进算法的技术思路,研究了K-Means算法在空间数据库中与空间索引方法结合的技术问题;分析了当前基于K-Means算法的R-树系列空间索引技术的研究成果,阐述了它们提高空间检索效率的技术路线及实验结果,研究显示这些技术都能在一定程度上提高数据检索的效率。最后给出了聚类与空间索引结合技术未来的研究方向。  相似文献   

5.
图像索引和相关反馈是改进基于区域的图像检索(RBIR)的2种有效的方法.本研究在图像索引方面采用随机局部搜索(RLS)算法对图像上的区域进行聚类,并引入倒查文件技术对图像库进行索引;在相关反馈方面,采用基于支持向量机的相关反馈算法来改善检索结果,并提出了一种新的核函数使该算法更适宜基于区域的图像表示.在海量图像数据库上的实验结果说明了该算法的有效性.  相似文献   

6.
基于SVD的二次型距离相似索引层次算法   总被引:2,自引:0,他引:2  
大容量多媒体数据库的基于内容相似性的检索本质上是高维特征空间中一定距离函数的 K近邻问题。对适合人类视觉的二次型距离函数 ,即使采用相似索引 ,当特征空间维数较高时检索仍不能保证实时性。为了解决此问题 ,提出基于 SVD(Singular Value Decomposition)的二次型距离相似索引层次算法 ,先以相似索引为基础在主导特征的子空间上进行代价低的近似检索 ,再对过滤结果在高维特征空间中进行线性的精确检索。实验证明 :该方法具有正确性、有效性和实时性  相似文献   

7.
针对现有面向内容音乐信息近似检索算法的弊端,结合递归算法的特点,设计了一种基于递归的面向内容的音乐信息近似检索算法.为配合该算法,设计了相应的基于R-tree树的音乐信息索引结构方案.经理论分析及与实验结果对比,可以看出以递归来设计音乐信息近似检索算法,可得到较佳的检索效率.  相似文献   

8.
基于Voronoi图的最近邻查询在计算几何中已被研究了相当长一段时间。但在以往的研究中,基于Voronoi图的最近邻查询究竟是基于何种具体的索引结构去实现对查询空间的搜索的,却很少被提及。本文把传统的R树和Voronoi图在解决最近邻查询问题中的优越性相结合,提出了一种新的索引结构:VR树。进而提出了基于VR树索引结构的NN查询算法并对这该算法进行分析,在理论上证明了这个算法较基于R树索引结构的最近邻查询算法优。  相似文献   

9.
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。  相似文献   

10.
对基于空间聚类的R-树的空间数据库索引技术进行研究,提出了面向R-树的空间混合聚类算法的改进算法,而将改进后的算法与其他算法的性能进行对比,可以发现:改进后的算法比其他空间聚类算法具有更大的优势.  相似文献   

11.
如何准确表达用户意图,判断网页与用户需求的相关性是信息检索技术研究的重要方向。本文提出了一种基于网页内容分割的语义信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。实验表明,本文提出的方法可以显著地提高搜索引擎的查询效果。  相似文献   

12.
针对传统图书检索系统只是基于关键字的检索,无法进行语义扩展,存在查全率和查准率不高的问题,将具有良好概念层次结构和对逻辑推理支持的本体引入到图书检索中,并设计了语义扩展算法和相似度算法,实现语义分析、语义扩展和相似度计算等功能,建立基于本体的图书信息检索的系统模型.结果表明,该系统能够在一定程度上增强检索系统的语义处理能力,改善传统检索系统的漏检、无效检索和检索结果过于无序和冗杂的缺点,使检索效率得到了改善.  相似文献   

13.
考虑到目前许多基于颜色直方图图像检索系统的搜索质量往往相当有限,提出一种融合分块小波直方图相似度检索和粒子群优化的新方法.该算法引入小波技术,提高了特征提取的有效性,采用分块技术扩展了图像检索性能,结合微粒群算法进行智能搜索加快了算法的执行速度.实验结果证实,该算法对图像数据库的相似度搜索是切实可行的,为大型图像数据库的智能图像检索问题提供解决方案.  相似文献   

14.
This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments.  相似文献   

15.
: This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two- or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its-successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments.  相似文献   

16.
提出了基于分割理论的三维模型检索算法,在利用分割算法获取模型部件集合的基础上,提取表征模型部件全局分布和表征模型局部形状的两类特征,并综合计算不同模型间的相似性,从而获得模型间总的相似程度.实验结果表明该检索算法能够获得更精确的检索效果.  相似文献   

17.
基于拼音索引的中文模糊匹配算法   总被引:3,自引:0,他引:3  
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。  相似文献   

18.
为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题。算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入二值化差值算法和改进后的Jaro-Winkler Distance算法分别对其进行相似度计算,2个相似度分别从不同方面反映汉字的相似程度,吸取2种方法的优势对其进行融合,得到最终字形相似度。实验结果表明,该算法在字形检索中较3元组递归算法准确率提高27.8%,较模板匹配算法、结构方法、神经网络算法执行效率平均提高约66.7%,该算法不仅可以有效解决形近字检索中的准确性问题,同时效率也得以优化。  相似文献   

19.
基于细粒度依存关系的中文长句相似度计算   总被引:1,自引:0,他引:1  
长句是中文书面语的常见现象,其由于结构复杂在计算句子相似度时难度较大。综合考虑依存关系中的关键元素,对中文依存句法树进行研究和分析,提出了一种细粒度依存关系的相似度计算方法。通过研究依存句法树中的各节点的词语、词性以及它们之间的依赖关系及其重要性权重等多个特征量,给出了两个依存句法树的相似度计算方法;基于该算法实现中文长句的相似度计算。实验结果表明该方法用于计算中文长句相比较其他算法有更高的准确率。  相似文献   

20.
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号