共查询到20条相似文献,搜索用时 62 毫秒
1.
针对图像检索任务中部分监督学习部署困难,以及一般无监督学习没有利用监督信息导致检索性能劣化的问题,提出一种基于正态分布的距离保持哈希的无监督框架,使生成的哈希码保持图像的原始距离关系,在检索结果中尽可能保留相似的图像;距离保持哈希使用正态分布框架约束生成的连续码保持原始特征的距离关系,将图像的语义信息尽可能保留到哈希码... 相似文献
2.
盲人脸修复任务是从低质量的图像(例如模糊、噪声和压缩图像)中恢复高质量的图像.由于事先不知道低质量图像的退化类型和退化参数,因此盲人脸修复是一个高度病态的问题,在修复过程中严重依赖各种先验指导.然而,由于面部成分和面部标志等面部先验通常是从低质量图像中提取或估计的,可能存在不准确的情况,这直接影响最终的修复性能,因此难以有效利用这些先验知识.此外,目前的主流方法基本都是依赖ConvNets进行特征提取,没有很好地考虑长距离特征,导致最终结果缺乏连续一致性.本文提出了一种改进的StyleGAN模型,命名为SwinStyleGAN,应用在高级视觉任务上表现出色的Swin Transformer来提取长距离特征,并通过改进后的类StyleGAN合成网络逐步生成图像.本文设计了一个空间注意力转换模块SAT来重新分配每个阶段特征的像素权重,以进一步约束生成器.大量实验表明,本文提出的方法具有更好的盲人脸修复性能. 相似文献
3.
针对现有哈希方法所存在的特征提取能力有限、量化约束机制低效等问题,提出一个深度多尺度注意力哈希网络进行大规模图像检索。整个网络由主分支和对象分支两个子网络组成。其中,在主分支网络中加入多尺度注意力定位和显著性区域提取两个模块,以有效定位和提取图像中的显著性区域,并将执行结果送入对象分支网络学习更为丰富的细节特征;同时,将两个子网络学习到的多粒度特征进行融合并执行二进制哈希编码;此外,引入三元组量化约束以减少量化误差,同时保持成对样本的相似度关系。为验证方法的有效性,文中在两个基准数据集上进行了广泛实验。实验结果表明,所提方法优于大部分现有的哈希检索方法。 相似文献
4.
网络图像资源增长迅速,如何实现快速有效的大规模图像检索,成为当前研究的热点之一。深度神经网络对图片特征有很强的表达能力,利用典型深度卷积神经网络VGG16在预训练完成的模型上使用网络全连接层的输出提取待检索图像数据集的特征以建立索引,并采用局部敏感哈希算法提升检索速度,以端到端的形式,完成基于内容的图片检索任务。这种图像检索模型提供了一种在计算资源有限情况下实现大规模图像检索的有效方法。 相似文献
5.
【目的】为了实现对虫害的精准监测,提出了一种融合Swin Transformer的图像实例分割优化方法,以期有效解决复杂真实场景下多幼虫个体图像识别分割困难的问题。【方法】选用Swin Transformer模型,改进Mask R-CNN实例分割模型的主干网部分,对黄野螟幼虫虫害图像进行识别分割。针对不同结构参数的Swin Transformer模型与ResNet模型,调整各层的输入输出维度,将其分别设置为Mask R-CNN的主干网进行对比实验,从定量与定性两个角度分析不同主干网的Mask R-CNN模型对黄野螟幼虫的识别分割精度与效果,确定最佳模型结构。【结果】(1)该方法在虫害识别框选方面的测度(F1)分数可达89.7%,平均精度(AP)可达88.0%;在虫害识别分割方面的F1分数可达84.3%,AP可达82.2%。相较于Mask R-CNN,在目标框选与目标分割方面分别提升8.75%与8.40%。(2)对于小目标虫害识别分割任务,该方法在虫害识别框选方面的F1分数可达88.4%,AP可达86.3%;在虫害识别分割... 相似文献
6.
以赤足足迹压力图像为研究对象,采集了40人的5 230幅赤足足迹压力图像,在具有较低存储消耗的哈希算法基础上,结合深度学习方法设计了一种深度中心匹配哈希(DCMH)网络实现足迹的检索.该网络首先根据足迹压力图像的特点构建深度特征融合模块,提取反映足迹形态结构的全局特征和压力分布的局部特征,并将两种特征进行融合;然后在哈希编码模块通过全连接层将融合后的特征映射为1 024维特征向量,并通过哈希层生成哈希码;在网络优化过程中通过构建深度中心匹配损失函数从而减小哈希码与对应哈希中心之间的距离.深度中心匹配损失函数通过伯努利分布生成哈希中心,设计对数中心损失函数减小同类足迹压力图像数据哈希码与哈希中心的距离,并设计相似性损失函数作为正则化项约束每个批次数据间的相似性关系.通过在40人的赤足足迹压力图像数据上进行图像检索实验,本文算法检索结果的mAP可以达到0.99,优于传统的哈希算法及常用的深度哈希算法,为足迹的进一步的现场应用提供技术支撑. 相似文献
7.
《西安交通大学学报》2017,(8)
针对目前哈希图像检索技术中多比特位量化方法通过将实数向量的每一维分别量化,割裂了实数向量各个维度之间联系的问题,提出了一种子空间自适应多位编码量化的哈希图像检索方法。该方法对一组实数做量化并且拓展到乘积空间,将实数向量划分为若干个数据子向量。由于子空间的方差和信息量大小呈正相关,该方法可根据子空间的方差计算并分配编码位数,使方差大的子空间拥有更长的编码位数,并且减小了因给不同的子空间分配相同的比特位而引起的信息损失,提高了编码的精度。在公开的图像数据集LabelMe和Flickr上的测试结果表明:与效果最优的同类方法相比,该方法使得量化误差下降了30%,检索结果的平均准确率提升了9.8%,说明可以通过减小量化误差来提升检索精度。 相似文献
8.
陈咏豪蔡满春张溢文万达 《中国人民公安大学学报(自然科学版)》2023,(3):59-64
计算机视觉的快速发展推动了人脸伪造技术的显著进步,深度学习的快速发展也使得人脸伪造变得越来越简单且难以识别。深度伪造的泛滥给国家和社会造成了负面影响。针对现有的深度伪造检测方法存在的准确率低、鲁棒性差等问题,利用可学习的分片方法和通道注意力单元对视觉转换器进行改进,并利用改进后模型进行深度伪造检测。具体而言,将可变形分块模块引入模型的每个阶段(Stage),并将通道注意力和自注意力结合构成混合注意力单元。此方法在两个通用深度人脸提取数据集上达到了0.981和0.989的曲线下面积(AUC),并取得了较好的鲁棒性和泛化性。 相似文献
9.
10.
本文针对低截获概率(Low Probability of Intercept, LPI)雷达信号调制类型的识别问题提出了一种基于Swin Transformer神经网络的识别方法. 该方法首先用平滑伪Wigner-Ville分布对信号进行时频变换,将一维时域信号变换为二维时频图像,然后使用Swin Transformer神经网络对图像进行特征提取及调制类型识别. 仿真结果显示,该方法具有较强的抗噪声能力,在低信噪比条件下识别准确率高,且具有较强的小样本适应能力. 相似文献
11.
提出一种建立在HSV空间颜色分类和形态特征基础上的图像Hash方法,用于图像检索.将图像尺寸规格化,并根据HSV空间中各分量的取值范围,将像素归为11类,在各类颜色成分中提取亮度、大小、形态等特征,加权得到Hash值以构成图像库的索引表,从而实现基于内容的图像检索(content-based image retrieval,CBIR).与其他方法相比,用该方法提取的图像特征除颜色外还包含形态特征,能较好地体现图像内容.实验结果表明,该方法具有良好的性能. 相似文献
12.
基于哈希算法的相似性检索以其高效性和实用性受到学术界的广泛关注。为了提升哈希学习算法的准确性和扩展性,提出了一种基于类标签的离散监督学习算法。首先,假设每个类标签都存在一个潜在的哈希码,并深入探索了类标签的关联性与其哈希码之间的关系,用以求解每个类的哈希码;然后,度量数据点的哈希码与类哈希码间的内积关系构建度量模型,同时采用非线性核函数建立量化模型;最后,在求解哈希码的过程中,采用了离散求解法以提升准确性。NUS-WIDE和CIFAR-10数据集的实验结果均表明,基于类标签的离散监督哈希算法是有效的。 相似文献
13.
提出了一种新型的基于载体选择的无载体隐写方案.发送端以迭代量化哈希为基础建立秘密信息与载体图像的联系,并根据此联系从图像库中选择合适的载体进行秘密信息传输,接收端根据事先约定好的规则,使用图像哈希技术从图像中提取出秘密信息.实验证明此方案在安全性方面优于传统的基于信息嵌入的隐写方案,且在鲁棒性与隐写容量方面略优于其他的无载体隐写方案. 相似文献
14.
《西安交通大学学报》2017,(6)
针对基元结构描述子在颜色空间的基础上再提取其他特征,导致偏重对颜色信息的描述而降低了图像检索性能的问题,提出一种应用在HSV颜色空间上的三结构描述子(TSD)的特征提取方法。该方法在HSV颜色空间中分别提取颜色和纹理信息,考虑到了颜色和纹理特征的同等重要性,同时避免了颜色信息的过多干扰;在纹理特征提取中,TSD利用像素间的信息变化来表示局部空间结构信息,解决了传统的局部模式方法忽略对局部结构的空间关系描述的问题,获得了更多的空间结构信息。实验结果表明,该方法在3个图像库Corel-1000、Corel-5000和Corel-10000上的检索准确率分别达到78.08%、38.12%和52.12%,与以往基元结构方法相比,检索准确率得到了提高。 相似文献
15.
一种基于颜色直方图的图像检索方法 总被引:1,自引:1,他引:1
在环形颜色直方图基础上采用具有视觉一致性的颜色空间——HSV,并把各通道分别进行非等间隔量化,采用各通道向量加权的形式把各通道组合为一个特征向量作为环形颜色直方图的颜色值,最后采用扩展的直方图交算法进行相似性匹配。实验验证了这种方法的有效性。 相似文献
16.
在图像数据库中,针对图像的检索方法很多,但以传统的基于内容的图像检索方法效率低,而且误差较大。文章提出一种基于OBFM(ontology based feedback model)方法首先得到基本相似图像库,从中提取相应的特征元素,并在此基础上进行关联规则挖掘。该算法采用本体论和相关反馈技术相结合的方法。实验证明,该方法比单纯的相关反馈技术准确率高。 相似文献
17.
18.
基于置乱和灰度扩散的图象置乱算法研究 总被引:2,自引:0,他引:2
置乱和灰度扩散是置乱图象的两种手段,其目的都是达到图象的不可认识.作者重点研究扩散算法,提出了传递扩散与局域扩散的概念,并详细分析了传递扩散算法在受到干扰或攻击时所引起的图象失真性.在此基础上,提出了局域单点扩散概念,产生了单点扩散与置乱相结合的图象置乱算法.实验证明,该算法具有很好的置乱效果和较高的鲁棒性,可广泛应用于数字图象的置乱操作. 相似文献
19.
20.
基于交叉分块直方图的图像检索方法 总被引:1,自引:1,他引:1
在基于内容的图像检索技术中,颜色是常用的图像特征。提出了一种基于交叉分块直方图的图像检索方法。首先,对图像进行交叉分块得到若干子图像;然后提取子图像的颜色直方图特征,构造特征向量;最后根据空间距离度量图像间的相似程度,确定检索输出结果。用交叉方式分块得到的子图像间相互交叉重叠,能够在获取图像颜色特征空间分布信息的同时保持图像目标的完整性,并有效抑制图像背景区域对检索结果的干扰。仿真实验结果表明,基于交叉分块直方图的图像检索方法具有优于基于均匀分块直方图的图像检索方法的性能,适用于对多种类型图像的检索。 相似文献