首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于深度学习模型的图像质量评价方法   总被引:1,自引:0,他引:1  
为了有效提取与视觉感知质量高度相关的图像特征,改进图像质量评价方法,在深度学习的框架下,提出一个全新的卷积神经网络IQF-CNN结构,能自动学习判别性更强的图像质量特征,并利用学习的特征进行图像质量评价.同时,该算法采用局部亮度系数归一化、dropout等技术进一步提高网络学习能力.实验结果表明:该算法能较准确地评估五种常用的图像失真,尤其在JPEG压缩、JPEG2000压缩和高斯模糊图像失真上与人眼主观感知质量具有很高的一致性,整体性能比较优于其他经典评价方法.  相似文献   

2.
空间信息表示是增强图像特征表达性能的重要手段,通过空间关系建模与深度学习方法融合可有效提升深度特征的语义特性,从而提升图像检索性能.首先,针对复杂图像的空间关系表示提出了一种新的精细拓扑结构表示模型,该模型不仅具有完备的拓扑描述性能,还提供了两种拓扑不变量的推理算法,使得拓扑不变量可以由表示模型直接推导而不需要繁复的几何计算;其次,基于精细拓扑结构表示模型,提出了有效的拓扑结构相似性度量方法,为空间关系特征表达奠定了基础;最后,进一步结合卷积神经网络,提出融合复杂空间关系特征与深度特征的多目标图像检索方法.实验结果表明,所提出的拓扑结构表示模型在空间查询中具有良好的性能;所提出的图像检索框架取得优于现有方法的精度,并能够有效地结合手工特征与深度特征各自的优势,为提升深度学习方法的可解释性创造了有利条件.  相似文献   

3.
为了提高跨模态人脸表示与合成的性能,针对语音与人脸图像2种模态数据,提出一种基于人脸参数化表示与稠密深度网络相结合的面部生成方法。针对输入语音模态,通过对信号进行频谱变换,将一维时域信号转换到二维频率域,可提取频域上稳健的特征描述;针对输出图像模态,利用主动外观模型对不同面部区域独立建模以降低区域间的相关性,并提取紧凑的人脸参数化特征;为了获得有效的跨模态学习性能,提出采用稠密连接的深度卷积神经网络学习语音、图像2种模态的回归预测,并通过预测的人脸参数进行面部重构,所采用的深度网络模型可以加强特征传播与特征复用,有利于增强面部细节的合成。在2组音视频数据集上验证了提出方法的有效性。  相似文献   

4.
度量学习是机器学习中的重要研究问题之一,针对实际应用中的噪声数据,如何建立一个鲁棒的度量仍是一个挑战.本文将稀疏表示、特征学习与分类模型相结合提出了一种新的基于鲁棒回归度量学习(RRML)的算法并将其应用于图像分类.算法对最优特征子空间和稀疏表示进行联合学习,在更具判别性的低维表征空间中,通过稀疏表示有效地编码数据的局部结构信息,进而更好地揭示数据的内在鉴别信息,并以此指导该模型学习到最优的投影矩阵;同时对噪声矩阵和投影矩阵的行稀疏约束,可以极大降低噪声的影响.实验结果表明所提算法在图像分类准确率和鲁棒性方面均优于其他对比算法.  相似文献   

5.
深度学习技术逐渐成为解决图像检索和图像分类问题的主流技术,然而现有算法不能有效地处理遥感图像中的复杂空间关系以及多尺度特征问题.为有效解决遥感图像检索问题,提出了一种综合考虑空间关系与尺度特征的新方法.首先,用深度学习方法检测过的遥感图像抽象为点集;其次,构造Delaunay三角网以描述全局空间关系特征;最后,在空间特征相同的部分中使用模糊性状模型匹配局部空间特征.该模型有效地规避了因尺度不同而产生的视觉差异.在UC Merced Land-Use和RS19等公开数据集上进行实验,结果表明,该算法在多尺度遥感图像检索精度方面的表现优于其他相关方法.  相似文献   

6.
提出一种基于深度学习的高效单幅图像超分辨率重建方法,增加一个亚像素卷积层和一个替换的级联卷积,即设计一个具有合适深度的卷积神经网络,以保证图像的重建质量,并采用级联小卷积核提高运行速度.在标准的公共数据集上进行实验测试,结果表明:与亚像素卷积神经网络(ESPCN)算法相比,所提算法重建的高分辨率图像的质量和速度皆显著提高;将其应用于实际项目中,可端到端地重建低分辨率服装风格图像,获得高分辨率图像.  相似文献   

7.
近年来,基于深度卷积神经网络的学习方法在图像降噪方面取得了前所未有的成果,通过调整网络结构和参数来获取更好的图像降噪效果已成为研究热点.降噪卷积神经网络在深度神经网络中采用残差学习方法,在提高降噪效果的同时,在一定程度上解决了盲降噪问题.其不足之处在于算法收敛时间长.该文针对降噪卷积神经网络结构做了进一步的改进,提出了一种基于反卷积降噪神经网络的图像降噪算法.该文工作的主要特色如下:1) 在原有的网络结构中,引入反卷积神经网络,优化了残差学习方式;2) 提出一种新的损失函数计算方法.使用BSD68和SET12测试数据集对本文提出的方法进行验证,实验结果表明,该文算法的降噪性能与降噪卷积神经网络算法相比,在相同降噪效果情形下,该文算法的收敛时间缩短了120%~138%.同时,与传统的深度学习图像降噪算法比较,该文方法的降噪效果和运行效率也都有提高.  相似文献   

8.
介绍了一种基于字典学习的去噪方法,并将其应用于降低低剂量CT图像噪声水平的研究.针对体模图像和病人图像,分别选择低剂量CT图像和正常剂量CT图像作为训练样本,采用K-SVD算法,通过迭代学习构建图像字典;然后,结合正交匹配跟踪算法,实现图像稀疏表示,稀疏成分对应于图像的有用信息,其他成分对应于图像噪声;最后,依据图像的稀疏成分重建图像,达到去除噪声的目的.实验结果表明:字典的大小、稀疏表示的约束条件等参数会显著影响所提算法的去噪结果;相比低剂量CT图像,将正常剂量CT图像作为训练样本可以得到更好的去噪结果;在相同的噪声水平下,所提算法与传统图像去噪算法相比可以更好地去除图像噪声,且保留了图像的细节信息.  相似文献   

9.
对近年来基于深度学习的单图像三维人体重建的研究现状和发展趋势进行了总结.首先,从模型表示和计算方法两个方面梳理了当前主要的单图像三维人体重建算法.在模型表示上详细介绍了四种常见表示方式及它们之间的相互转化关系,包括深度图像与点云表示、参数化人体模型表示、体素及语义体素表示及隐式曲面函数表示.在计算方法上深入描述了基于上述四种表示方式所提出的算法,并分析了其优缺点;接着,介绍了单图像三维人体重建常用的公共数据集和客观评价指标;然后,在公共数据集上从客观指标和可视化两个角度对当前先进方法进行了评价和对比;最后,在实验结果的基础上总结了当前方法存在的问题和挑战,并展望了单图像三维人体重建未来潜在的研究方向.  相似文献   

10.
针对目前深度多视角子空间聚类算法因为缺少对自表达矩阵的低秩表示约束而导致的模型缺乏鲁棒性的问题,提出了深度低秩多视角子空间聚类算法。在深度多视角子空间聚类算法的基础上,通过矩阵分解将自表达层分解为多视角一致性自表达层和单视角特异性自表达层,得到具有低秩线型约束的双层自表达模块;强制所有视角的一致性自表达层的参数相同、特异性自表达层的参数各不相同,充分利用多视角数据的互补性;将自表达模块嵌入到每个视角的深度自编码器中,得到可以通过反向传播算法求解的深度低秩多视角子空间聚类模型;在深度模型训练中,一致性自表达层学习多视角数据的一致性信息,特异性自表达层学习单个视角的独特信息,双层自表达模块隐性地添加了低秩表示约束。6个公开数据集上的实验结果表明:与深度多视角子空间聚类算法相比,所提算法的聚类正确率平均提升了0.064,标准化互信息提升了0.064;所提算法的正确率和标准化互信息优于其他11种先进聚类算法的,聚类正确率最大提升了0.097,标准化互信息最大提升了0.103。  相似文献   

11.
张茜  孙一佳  白琳  李陶深 《广西科学》2019,26(3):283-290
根据蛋白质氨基酸链探测其同源蛋白质,进而预测蛋白质的功能,是生物信息学研究领域的一个重要挑战,也是众多生物医学研究领域的基础研究内容,有着重要的科研价值和广泛的应用需求。其研究难点在于:(1)如何学习对同源蛋白质预测有效、有用的蛋白质特征信息;(2)如何更好地运用蛋白质特征信息,实现同源蛋白质的探测与识别。为了解决同源蛋白质探测与识别研究中的关键难点,本文提出一种基于混合深度学习架构的同源蛋白质探测与识别模型(HDLM-PHP)。通过采用统一的"管道式"深度学习架构,将蛋白质特征学习和探测识别统一为一个整体,提高同源蛋白质探测与识别的效能。采用多组并行的深度卷积神经网络,学习蛋白质的各种属性信息,以期获得丰富的待检测蛋白质和靶蛋白质的高级相关性特征,并通过全连接方式使用多层RBM结构融合和精炼这些相关性特征为全局相关性特征。通过统一的深度网络连接方式,以探测和识别任务为导向,学习到对于同源蛋白质预测最有效、最全面的蛋白质特征信息。在标准数据集SCOPe上,对所提模型进行性能与效率评测,结果表明:本文提出的模型能有效地学习到符合任务导向的蛋白质特征数据,提升同源蛋白质探测与识别的准确度和召回率,优于现有的模型和算法。  相似文献   

12.
知识图谱的表示学习方法将实体和关系嵌入到低维连续空间中,从而挖掘出实体间的隐含联系.传统的表示学习方法多基于知识图谱的结构化信息,没有充分利用实体的描述文本信息.目前基于文本的表示学习方法多将文本向量化,忽略了文本中实体间的语义关联.针对上述缺点提出一种利用实体描述文本进行增强学习的方法,基于文本挖掘出关联性实体并对关联性进行分级,将关联性作为辅助约束融合到知识图谱的表示学习中.实验结果表明,该辅助约束能明显提升推理效果,优于传统的结构化学习模型以及基于深度学习的文本和结构的联合表示模型.   相似文献   

13.
传统的年龄回归方法不能学习深层次信息,因此利用能充分挖掘上下文关系信息的深度学习方法来识别用户的年龄。具体而言,提出了一种基于LSTM的年龄回归方法,其能够学习长期依赖关系即建立输入值之间的长相关联系。采用了两种不同的特征,即文本特征和社交特征。为了有效地区分这两种特征,充分利用这两种特征之间的信息,进一步提出了基于双通道LSTM的年龄回归方法,具体实现是在神经网络中加入Merge层,将LSTM分别产生的文本特征表示和社交特征表示结合进行集成学习以充分学习文本特征和社交特征间的联系。实验结果表明,基于双通道LSTM的年龄回归方法能够有效地区分文本特征和社交特征,并且较单个LSTM方法能够取得更好的年龄回归性能。  相似文献   

14.
相似案例匹配任务旨在判断2篇裁判文书所描述的案件是否相似,通常被看作裁判文书的文本匹配问题,在司法审判过程中具有重要的应用。现有深度学习模型大多将案例长文本编码为单一向量表示,模型很难从长文本中学习到裁判文书之间的细微差异。考虑到案例文本各部分的内容较为固定,本文提出将案例长文本拆分为多个片断并分别编码,以便获取不同部分的细微特征;同时,采用可学习仿射变换改进相似度打分模块,使模型学习到了更多细微的差异,进一步提高了案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,本文提出方法与现有方法相比准确率提升了1.89%。  相似文献   

15.
为解决弱情感倾向语料影响文本情感分类的问题,提出基于全局语义学习的文本情感增强方法。首先设计语料划分方法,将语料划分为强情感倾向语料与弱情感倾向语料,然后,从文本处理全过程及整体语义学习的角度出发,构造均值抽取与最大值抽取的语义提取方式及文档信息向量,改进基于循环神经网络的变分自编码器的语义学习过程,并用于学习强情感倾向语料中文本的词语序列特征与语义特征。基于此,对弱情感倾向语料进行重构,实现情感增强目标,最后,将经过情感增强的语料替换掉原来的弱情感倾向语料,再进行情感分类模型的训练与测试。结果表明:提出的文本情感增强方法能够提升情感分类效果,并使得Bert分类器对IMDb影评数据集的情感分类精确率达到了93.03%。  相似文献   

16.
深度学习通过建立深层神经网络来模拟人脑进行分析、学习和解释数据,被广泛用于图像识别领域.首先,简述了深度学习在图像识别中的研究现状;其次,介绍了卷积神经网络、深度置信网络、循环神经网络和生成对抗网络等几种常用于图像识别领域的深度学习网络模型;然后,从人脸识别、动作识别、跌倒检测等方面,论述了深度学习在图像识别领域的典型应用;最后,探讨了该领域的研究难点及发展前景.深度学习可以从不同的图像中自动提取相似的特征并进行分类,识别率高,鲁棒性强,推动了人工智能背景下图像识别的发展.无监督学习、对抗网络等将成为深度学习领域的热点.  相似文献   

17.
作为一种跨摄像头的检索任务,行人重识别会受到不同相机视角造成的图像样式变化的影响。近年来,许多算法通过神经网络直接从原始输入图片中学习相应特征,虽然这些特征能够很好地描述全局行人,但忽略了许多局部细节信息,在复杂的场景下容易出现误识别。针对此问题,研究了一种基于多任务学习的新的特征表示方法,采用成对输入的孪生网络结构,将局部最大出现特征(local maximal occurrence,LOMO)和深层特征一起送入网络并映射到单一的特征空间中进行训练,形成一种新的网络模型TDFN(traditional and deep features fusion network)。利用神经网络自我学习特性,联合多个任务的损失函数更新网络,使得深层特征学习到更多与手工局部特征互补的细节信息。实验表明,新特征的平均精度mAP和Rank-1精度都优于直接从孪生网络提取的全局描述子。  相似文献   

18.
为了分析突发事件期间网络舆论的情感倾向,以更有效地调节人们的情绪,维护社会稳定。本文提出了一种融合BERT模型和多通道卷积神经网络的深度学习方法用于细粒度情感分类,以获取更加丰富的文本语义特征信息。通过BERT 对输入的文本进行编码,以增强文本的语义特征表示,再通过具有多个不同大小的卷积核的并行卷积层来学习文本特征,捕获文本的深层次特征,提升模型在文本分类的性能。对比实验表明,该模型在准确性、召回率和F1值方面均优于传统的情感分类模型,并能显著改善细粒度情感分类的性能。除此之外,本文还探究了表情符号对细粒度情感分类模型的影响,实验结果表明表情符号转换成文字后可以增强文本的情感特征提取能力,提升模型分类性能。  相似文献   

19.
多价值链协同发展背景下,制造企业没有充分考虑服务链、营销链等其他价值链对产品需求的影响。为提高制造企业产品需求预测的精度,本文提出了产品数据空间和一维卷积神经网络(One-dimensional convolutional neural networks, 1D-CNN)-长短期记忆神经网络(Long short-term memory, LSTM)的深度学习算法。首先,整合不同价值链对产品需求影响的相关数据构建产品数据空间。其次,从数据空间中获取多链数据集用于1D-CNN-LSTM模型的预测。其中,1D-CNN通过两次卷积池化操作获取数据的深层次特征,LSTM则通过进一步学习数据特征中的重要信息来进行时间序列预测。最后,通过某电气设备制造企业生产销售的环网柜产品的相关数据进行算例分析,并与其他几种模型进行预测结果比较。结果表明:1D-CNN-LSTM模型的预测效果优于神经网络模型和单一的LSTM模型。可见本文提出的1D-CNN-LSTM深度学习模型更具优越性,预测效果好。  相似文献   

20.
当前图像识别大多采用基于特征提取的传统机器学习方法与卷积神经网络的方法,但传统图像识别技术需要手动提取图片特征,而卷积神经网络对硬件要求高,训练时间长等。针对以上问题,本文提出基于深度神经网络模型的手写体图像识别方法,让机器自动学习特征,并在此基础上,通过改进成本函数,加入dropout防止过拟合,来提高手写数字识别的识别率。仿真实验对比结果表明,基于深度神经网络模型的方法比当前传统算法的识别率提高了3.41%,有效解决了人工识别费力耗时问题,对手写数字的研究具有重要意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号