首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 19 毫秒
1.
大规模图像检索具有广泛的应用前景,其核心在于图像特征提取和高效相似性计算.深度学习技术在图像特征提取具有较强的特征表示能力,同时哈希技术在高维数据近似计算方面具有较好的性能.目前,基于哈希学习的技术在大规模图像检索及相似性查询方面获得了广泛的研究和应用.本文结合卷积神经网络和哈希技术实现商标图像检索,通过深度学习技术提取商标图像特征,使用位哈希对数据对象编码,在海明空间折中查询的质量和效率.基于卷积神经网络模型,提出了深度哈希算法,并研究了损失函数和该数据集上的优化器选择,通过获取符合哈希编码规范的位编码实现对在二元空间对商标图像数据快速检索,该方法分为离线深度哈希学习和在线查询两个阶段.在真实商标数据集上进行实验,实验结果表明,本文方法能够在商标数据集上获得较高质量的位编码,并具有较高的检索精确度和在线查询效率.  相似文献   

2.
为了提高图像检索精度,文章在谱哈希的基础上引入最小量化误差的思想,提出了一种基于改进谱哈希的大规模图像检索算法,该算法避免了谱哈希中要求的数据服从均匀分布的假设,并且能够保持数据在原始空间的相似性;引入Boosting算法来确定阈值,使得该算法具有更强的适应性和更广泛的应用;在公开的图像数据集上做了实验,实验结果表明该方法优于谱哈希、局部敏感哈希和迭代量化等哈希算法。  相似文献   

3.
哈希方法作为最近邻搜索中的一个重要算法,具有快速及低内存的优良特性,能够较好地解决现实图像数据库中存在的样本标签信息缺失、人工标注成本过高等问题,因此在图像检索领域得到广泛使用.提出一种基于语义相似度的无监督图像哈希方法.首先对原始图像进行语义聚类,然后基于图像的语义相似性,把原始图像特征映射到汉明空间;同时,为了增强哈希学习的鲁棒性,在所得到的目标函数中,采用了l2,p范数(0p≤2)来代替l2范数进行哈希学习.通过在两个公共图像检索数据库CIFAR-10和NUS-WIDE的实验结果证明,与现有方法相比,本方法的平均精度均值提升了5%.  相似文献   

4.
网络图像资源增长迅速,如何实现快速有效的大规模图像检索,成为当前研究的热点之一。深度神经网络对图片特征有很强的表达能力,利用典型深度卷积神经网络VGG16在预训练完成的模型上使用网络全连接层的输出提取待检索图像数据集的特征以建立索引,并采用局部敏感哈希算法提升检索速度,以端到端的形式,完成基于内容的图片检索任务。这种图像检索模型提供了一种在计算资源有限情况下实现大规模图像检索的有效方法。  相似文献   

5.
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.  相似文献   

6.
提出了一种基于改进混合并行遗传算法的多文档文摘方法.该方法将k-means聚类算法的高效、局部搜索特性,和并行遗传算法的全局优化能力有机结合,解决了k-means算法对初始聚类中心的选择较为敏感,易于陷入局部最优等问题,提高了多文档聚类算法的效率和精确度.  相似文献   

7.
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果.  相似文献   

8.
图像匹配是计算机视觉中一个重要的研究方向,是图像拼接、图像检索等相关应用的基础工作。如何实现快速、高效的图像匹配技术是本文的主要研究内容。提出一种基于SURF和扩展哈希的空间约束图像匹配算法,为了提高特征检测的速度,首先提取SURF特征描述图像局部特征,然后在局部敏感性哈希算法基础上,提出一种改进的高维数据搜索算法,该改进算法变换局部敏感性哈希的投影空间,使变换后的每一维特征数据都比原算法具有更好的局部敏感性。最后采用空间约束RANSAC算法剔除误匹配点,进一步增加算法的鲁棒性。实验结果表明,本文提出的算法与传统算法如BBF、LSH以及iDistance等算法相比具有更优的搜索效率,在一定程度上提高了图像匹配的性能。  相似文献   

9.
为了实现大数据环境下非线性高维数据的快速降维,提出了一种基于Spark的并行ISOMAP算法.在该算法中,为了快速构建邻域矩阵,设计并实现了基于精确欧式位置敏感哈希的近邻搜索并行算法;为了实现特征值的快速求解,设计并实现了基于幂法和降阶法交替执行的特征值求解并行算法.为了进一步提高算法的性能,基于Spark的特性,利用Spark的稀疏向量、广播机制和缓存机制对并行ISOMAP算法进行了优化,减少了计算过程中的内存消耗和数据传输.在Swissroll数据集和S-curve数据集上的实验结果表明,基于Spark的并行ISOMAP算法通过并行执行和计算过程的优化,极大地提高了算法的执行效率,能够适用于大规模数据集的降维处理.  相似文献   

10.
图像搜索时需要尽可能地保留图像语义相似性,传统的哈希图像检索方法大多是基于人工视觉特征的,它的性能已经满足不了现在图像搜索的要求.为了解决这个问题,我们将哈希编码和卷积神经网络结合起来,旨在研究出一个更好的检索方法.本文使用卷积神经网络中的AlexNet模型和哈希编码结合,改进了传统的图像搜索算法,缩短了神经网络的训练时间,提高了哈希算法的效果.我们选用CIFAR-10数据集来进行相关实验.实验结果表明,该方法相比于传统的图像检索方法具有多方面的优越性.  相似文献   

11.
在图片相似性搜索中,需要将图片特征向量的相似性搜索问题转化为K近邻问题,这就需要了解K近邻问题的定义,以及局部敏感哈希的数学定义。此外,还需引入一个可以用于实际应用的局部敏感哈希的算法,并分析此算法的正确率和算法复杂度。  相似文献   

12.
混合语义模型的产品知识文档检索   总被引:1,自引:0,他引:1  
为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.  相似文献   

13.
现有全文检索技术多是以文本信息为处理对象,对于以数学表达式为主要成分的科技文档检索还处在探索阶段.为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索,提出了一种基于数学表达式特征的科技文档检索模型.首先通过将公式解析为二叉树得到数学表达式的子式信息,利用数学表达式及子式构造检索特征向量;在索引阶段,利用所提取的文档特征向量构建分层结构的索引表;在匹配阶段,对文档向量采用tf-idf进行加权操作,利用余弦相似度对检索向量和文档向量进行相似度计算,得到一个有序的文档检索结果.实验选取了来自不同领域的期刊、学术网站以及公共数据集的5 017篇科技文档,其中包含了96 362条数学公式,平均检索时间为0.428s,表明该模型达到了实现较高效率科技文档检索的目标.  相似文献   

14.
针对燃气轮机剩余使用寿命预测中监测数据信息利用不够充分、退化过程难以表示、预测精度低等问题,提出了一种基于局部敏感哈希-双层随机森林的燃气轮机剩余使用寿命预测方法.该方法首先使用主成分分析充分利用多维监测数据信息构建健康因子来表示退化过程,并通过滑动截取的方法在健康因子曲线上获取训练数据;然后,通过p-stable分布局部敏感哈希相似性搜索算法匹配和需要预测的样本最相似的样本;进而,使用双层随机森林对剩余使用寿命进行回归预测.利用C-MAPSS数据集验证了该方法的有效性和准确性,研究结果可为其他非线性退化系统剩余使用寿命预测提供一定的参考.  相似文献   

15.
考虑到传统信息检索算法在检索数字文献推广信息时存在安全性差、检索效率低的问题,提出了基于语义相似度的数字文献推广信息智能检索算法.基于数字文献检索信息文档,计算了数字文献推广信息中检索词的相关度,根据语义相似度,计算数字文献推广信息的权重值,利用数字文献推广信息数据库的查询结果,结合李雅普诺夫定理,提取数字文献推广信息关键特征,根据采集原始数据集的时间,计算数字文献推广信息的平均检索概率,利用过滤器清理数字文献数据库的局部推广信息,采用全局过滤器,清洗数字文献数据库的推广信息,通过定义数字文献推广信息检索元素值,计算了关键词之间的语义相似度,结合数字文献推广信息检索算法设计,实现了数字文献推广信息的检索.实验结果表明,基于语义相似度的数字文献推广信息智能检索算法不仅可以提高数字文献推广信息的检索效率,还具有很高的安全性.  相似文献   

16.
基于粒子群算法, 提出一种针对基于点表示模型的新特征检测方法, 解决了大规模数据模型特征的快速显示问题. 该方法对粒子群优化算法进行优化, 将其应用于物体空间的特征检测上, 实现了多目标搜索. 通过对粒子群算法中的粒子、适应度函数、 初始结束条件、 局部最优解、 全局最优解和迭代公式的重新定义, 将局部搜索与全局搜索相结合, 可快速搜索到多个目标. 该算法通过构造可估计局部曲面变化的适 应度函数检测特征点, 并对特征点做标记, 以快速显示出模型的特征. 实验结果表明, 所提出的特征检测算法适用于对基于点表示的模型的快速特征检测, 尤其适用于大规模数据模型  相似文献   

17.
肺结节CT图像的相似性检索是计算机辅助诊断系统中最重要的部分,目前常用的检索方法通常匹配精度低,检索速度慢.针对上述问题,提出一种新的基于视觉信息与征象标签的双概率超图哈希算法,使用两层结构提高肺结节图像的检索精度:在第一层,将肺结节影像视觉信息和标签信息分别构建概率超图,最优划分概率超图得到哈希码;在第二层,使用结节图像的视觉特征、标签特征和第一层得到的哈希码来训练哈希函数.在检索时,对待检图像通过训练好的哈希函数进行0,1编码,与数据集中图像比较汉明距离,返回相似结节图像.对9种不同征象类型的3422张肺结节CT图像进行实验,并与不同哈希算法进行比较,结果表明,提出的方法在哈希码长为32位时可以达到最高精度90.18%,有效提高了检索精度,可以给医生提供客观的辅助诊断.  相似文献   

18.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

19.
在深度有监督哈希图像检索的特征提取过程中,一直由卷积神经网络架构主导,但是随着Transformer在视觉领域中的应用,Transformer替代卷积神经网络架构成为可能.为了解决现存基于Transformer的哈希方法中不能生成层次表示和计算复杂度高等问题,提出了一种基于Swin Transformer的深度有监督哈希图像检索方法.该方法以Swin Transformer网络模型为基础,在网络最后添加一个哈希层,为图像进行哈希编码.该模型中引入了局部思想和层级结构,能够有效解决上述问题.与现有的13种先进方法相比,所提方法的哈希检索性能得到大幅提升.在两个常用检索数据集CIFAR-10和NUS-WIDE上进行实验,实验结果表明:在CIFAR-10数据集上所提方法mAP最高达到98.4%,与TransHash方法相比平均提高7.1%,与VTS16-CSQ方法相比平均提高0.57%;在NUS-WIDE数据集上所提方法mAP最高达到93.6%,与TransHash方法相比平均提高18.61%,与VTS16-CSQ方法相比检索精度平均提高8.6%.  相似文献   

20.
许多生物信息学软件涉及将核苷酸序列翻译成对应的氨基酸序列的操作.密码子检索表的结构及检索算法强烈地影响蛋白质翻译的速度.本文提出了2种快速的密码子检索方法.一是平均检索长度约为7,最大检索长度为9的分块检索;二是没有空间冗余和地址冲突的哈希表检索,其平均检索长度和最大检索长度均为3.对几种密码子检索方法的检索效率进行比较,结果表明哈希表的检索速度最快.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号