首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
现有的针对真实失真的无参考图像质量评价算法提取的特征对自然场景图像质量的表征能力较差,限制了其评估准确性和泛化能力。针对该问题,文中提出了一个基于多尺度特征逐层融合的深度神经网络(MsFF-Net)。首先,利用预训练的深度神经网络ResNet-50提取图像多尺度特征;然后,提出了一种特征融合模块,通过逐层递进融合相邻尺度特征,获得更准确表征图像质量的多尺度融合特征;接着,从多尺度融合特征提取低维特征,得到多粒度的图像质量感知特征;最后,利用由最高层特征自适应生成的全连接神经网络,对低维特征进行回归,得到自然场景图像的质量预测。仿真结果表明,MsFF-Net在真实失真数据库上的性能优于目前的大多数方法,而且在合成失真数据库上也取得了出色的评价性能。  相似文献   

2.
细粒度识别的主要目的是在相同基本类别下对其繁多的子类别进行区分。不只局限于头和躯干的定位现状,提出了一种基于Faster RCNN联合语义提取和检测的分类方法。通过引入自上而下的方法来生成七个小语义部位,既大大减少了候选区域的个数,又提高了分类的效率。检测子网可以和区域候选生成网络(RPN)共享卷积特征,结果使得区域建议几乎不花时间,从而可以生成高质量并且具有局部特征的区域建议框,便于Fast RCNN的检测。相对于其他鸟类识别研究,实验中鸟类识别准确率达到了88.37%,提高了识别效率。说明联合语义的Faster RCNN网络适用于鸟类的细粒度识别。  相似文献   

3.
针对自然场景中交通标志识别问题涉及的识别准确率和实时性改善需求,提出了一种改进的基于多尺度卷积神经网络(CNN)的交通标志识别算法.首先,通过图像增强方法比选实验,采用限制对比度自适应直方图均衡化方法作为图像预处理方法,以改善图像质量.然后,提出一种多尺度CNN模型,用于提取交通标志图像的全局特征和局部特征.进而,将组合后的多尺度特征送入全连接SoftMax分类器,实现交通标志识别.采用德国交通标志基准数据库(GTSRB)测试了所提算法的有效性,测试结果表明,算法在GTSRB基准数据集上获得98.82%的识别准确率以及每幅图像0.1ms的识别速度,本文算法具有一定的先进性.  相似文献   

4.
首先, 针对人脸表情识别问题提出一种新的多尺度特征选择网络识别方法, 该网络充分结合多尺度网络结构和特征选择结构的优点, 能更有效地提取面部静态图像中的空间信息. 其次, 为验证本文提出的多尺度特征选择网络的识别性能和泛化能力, 在两个经典的人脸表情识别数据集上与一些常用的方法进行对比和交叉验证实验. 实验结果表明, 该网络取得了更好的识别效果, 并且具有良好的泛化能力, 可以灵活地嵌入到人脸表情识别分析系统中.  相似文献   

5.
在传统的模糊字迹图像识别过程中,忽略了字迹变化尺度对图像的影响,导致识别准确度低识别能力差的问题,提出基于深度卷积神经网络的模糊字迹图像识别方法.通过图像的退化模型,对模糊字迹图像稀疏性特征进行分解,构建模糊字迹图像的多源特征参数检测模型,结合边缘轮廓特征提取方法实现对模糊字迹图像的边界信息采样分析;采用多维参数模拟和模糊度增强处理,结合匹配滤波检测器对图像的多级尺度分解和细节特征进行提取,对提取的模糊字迹图像细节特征进行融合和优化检测,采用深度卷积神经网络训练方法进行模糊字迹图像修复处理,实现模糊字迹图像的识别.仿真结果表明,采用该方法进行模糊字迹图像识别的准确性较高,检测能力较强,提高了模糊字迹图像修复和辨识能力.  相似文献   

6.
为解决从单目图像中很难恢复出准确、有效深度信息的问题,提出一种多尺度特征融合的单目图像深度估计算法.算法采用端对端训练的卷积神经网络(CNN)结构,引入从图像编码器到解码器的跳层连接来实现在不同尺度上特征的提取和表达,设计了一种多尺度的损失函数来提升卷积神经网络的训练效果.通过在NYU Depth V2室内场景深度数据集和KITTI室外场景深度数据集上的训练、验证和测试,实验结果表明:提出的多尺度特征融合方法得到的深度图边缘清晰、层次分明,且在室内场景和室外场景中均能适用,具有较强的泛化性,可以适应多种实际场景的需求.  相似文献   

7.
高精度的实时交通标志检测和识别对安全自动驾驶和智能交通系统至关重要。本研究对基线网络YOLOV4进行了升级,增加了多尺度融合模块和注意力机制模块(AMM),丰富了不同尺度交通标志的特征表示。同时,颈部网络结合了特征选择模块和特征对齐模块,增强了高、低层特征图之间像素偏移的语义判别。具体地说,针对AMM,设计了一种转置的自注意力操作。其使用互协方差矩阵将令牌维度上的操作转换为通道维度,将时间复杂度从O(n2)降低到O(n)。在TT100K交通标志数据集上的实验结果表明,与基线网络(mAP@0.5=76.4%)相比,升级后的网络(mAP@0.5=83.4%)取得了较好的改进,检测和识别速度可达39.45帧/秒,达到了目前最先进的水平。  相似文献   

8.
为了能够在细粒度图像特征表示中探索出相似层结构中的共享信息,提出了一种多任务学习框架,联合优化卷积神经网络中的Softmax Loss和Triplet Loss,基于此框架,设计广义三元组嵌入标签结构,以发现不同级别中具有相似性的相关图像。在Stanford Cars和CUB200-2011两个细粒度数据集上进行实验,结果表明这种方法不仅可以实现较好的分类性能,还能够提高在细粒度数据集上不同级别的标签结构的图像检索精度,这在电子商务中相关产品的推荐方面具有重要意义。  相似文献   

9.
提出一种多特征与卷积神经网络相结合的人脸表情识别方法。先对人脸表情图像进行预处理,根据人脸面部"三庭五眼"的特征和人脸的几何模型对图像进行裁剪,采用双三次插值法对图像进行缩放。然后提取样本的局部方向模式、二维离散小波变换、Sobel算子三种特征。将这三种特征以三通道图像的形式输入卷积神经网络中进行自适应融合,融合后的特征通过Softmax层进行分类。在CK+数据库的识别率为99.51%,在RAF-DB的识别率为72.1%,识别率都有所提升,验证了所提方法的有效性。  相似文献   

10.
基于神经网络实现的仿生识别系统不仅存在输入尺度限制问题,还由于数据格式的差异不兼容现有解决方案.针对此问题,提出用于仿生识别系统的3种不同多尺度输入解决方法,分别为基于输入事件的缩放法,基于动态窗口的多尺度池化法以及一种新的基于池化层特征的特征缩放法.实验基于相同的前馈分类系统,进行各方法的资源消耗和系统识别率对比.结果表明,多尺度池化法对应的权值数仅为其他两种方法的3.83%,但识别率较低;相比事件缩放法,所提出的特征缩放法能够提升识别率5.54%,算法执行次数减少59.16%,适用于仿生识别系统.  相似文献   

11.
在复杂交通场景中,公安和交管部门对车型识别的实时性和精度提出了更高要求。针对当前假牌、套牌、无牌车辆处理占用大量警力、检索效率低下、非智能化等一系列问题,提出了一种基于GoogleNet深度卷积神经网络的车型精细识别方法,设计了合理的卷积神经网络滤波器大小和数目,优选了激活函数和车型识别分类器,构建了一个新的卷积神经网络轿车车型精细识别模型框架。实验结果表明,在车型精细识别测试中,所提出模型的识别率达到了97%,较原始GoogleNet模型有较大提升,而且,新模型有效地减少了训练参数的数量,降低了模型的存储空间。车型精细识别技术可应用于智能交通管理领域,具有重要的理论研究价值与实践意义。  相似文献   

12.
卷积神经网络中的卷积操作只能捕获局部信息,而Transformer能保留更多的空间信息且能建立图像的长距离连接.在视觉领域的应用中,Transformer缺乏灵活的图像尺寸及特征尺度适应能力,通过利用层级式网络增强不同尺度建模的灵活性,且引入多尺度特征融合模块丰富特征信息.本文提出了一种基于改进的Swin Transformer人脸模型——Swin Face模型.Swin Face以Swin Transformer为骨干网络,引入多层次特征融合模块,增强了模型对人脸的特征表达能力,并使用联合损失函数优化策略设计人脸识别分类器,实现人脸识别.实验结果表明,与多种人脸识别方法相比,Swin Face模型通过使用分级特征融合网络,在LFW、CALFW、AgeDB-30、CFP数据集上均取得最优的效果,验证了此模型具有良好的泛化性和鲁棒性.  相似文献   

13.
研究了车牌字符识别问题,针对车牌识别系统易受天气及光照变化影响的实际应用,将Gabor特征和协同神经网络应用在车牌字符识别中,提高了识别率.首先对车牌字符进行二值化和切分,然后利用Gabor滤波器提取车牌字符的特征参数;再利用协同模式训练特征参数,进而得出训练样本;最后根据协同神经网络进一步识别车牌字符.通过大量仿真实验表明,该方法在不同场景、光照条件下,与传统方法相比,识别率有了较大改进,该方法在车牌识别领域有较强的实用性.  相似文献   

14.
为了改善图像表情和图像序列表情识别效果,针对传统表情识别特征提取复杂和效果不理想问题,提出了一种深度残差网络和局部二值模式(local binary patterns,LBP)相结合的特征提取方法,利用深度残差网络提取数据集的空域特征,长短期记忆网络(long short-term memory,LSTM)处理时域特征,实现空域与时域特征的结合。研究了不同层数的残差网络、不同形式的LBP算子以及其他网络结构对人脸表情识别的影响,对比了支持向量机和随机森林实现的序列表情识别算法。在Cohn-Kanade数据集和AFEW6.0数据集上进行了验证,实验结果表明,算法在验证集上的准确率分别为73.1%和58.4%,相比其他算法有一定程度的提升。  相似文献   

15.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。  相似文献   

16.
针对在有冗余图像信息干扰下进行人脸有效特征点提取时精度不高的问题,提出了基于级联卷积神经网络的人脸特征点检测算法.在该算法中:输入层读入规则化的原始图像,神经元提取图像的局部特征;池化层进行局部平均和降采样操作,对卷积结果降低维度;卷积层和池化层分布连接,迭代训练,输出特征点检测结果.该算法采用Python语言编程实现,在人脸数据集进行仿真实验,结果表明该算法对人脸特征点有较高的识别率.  相似文献   

17.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

18.
提出了利用BP神经网络方法来实现手写数字识别系统的方案。手写数字图像通过颅处理后,在特征提取方面采用两种适应性较强的特征提取方法,即18点特征提取方法和手写数字笔画特征提取法.不但减少了提取时间。而且提高了手写数字图像的识别率。利用Visual C++编写手写数字识别系统,得到了较好的识别结果。  相似文献   

19.
基于改进的BP网络数字字符识别   总被引:1,自引:0,他引:1  
提出了一种基于改进的BP网络方法来实现数字字符识别.通过对BP网络的神经元的研究与学习,设计了一种结构合理,收敛速率快的BP网络.试验测试结果表明,改进的BP网络方法对印刷体数字的识别率达到了100%,对手写数字的识别率达到了98%以上.  相似文献   

20.
基于组合神经网络的与文本无关的说话人识别   总被引:1,自引:1,他引:0  
提出了一种用于N个说话人识别的组合神经网络,由N个子网组成,每个子网完成两类模式区分,将这N个子网组合起来完成N类模式的区分.子网选用RBF神经网络,并给出了自组织选取中心的方法.实验显示,对6名说话人,识别率达到94%.对10名说话人,识别率达93.17%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号