首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
杨磊  赵红东 《科学技术与工程》2020,20(33):13757-13761
环境声音识别(Eenvironment Ssound Rrecognition ,ESR)在基于情景感知和辅助技术等领域发挥着重要作用。卷积神经网络(CNN)和循环神经网络(RNN)作为两种最具代表性的特征提取方法,在语音和音乐信号处理方面都取得显著效果,然而二者都存在一定缺点,CNN无法有效提取时间特征,RNN在提取空间特征上也存在明显劣势。为了有效的提取并利用时间特征和空间特征,提出一种新模型,利用时间分布卷积神经网络(CNN)从梅尔频谱图中提取城市环境声音特征,然后应用双向长短时记忆网络(BiLSTM)从CNN输出中获取时间信息,最后在BRNN的输出序列上实施注意力机制,从而关注到与城市环境声音最相关的特征进而做出分类判断,注意力机制既提高了分类准确性,又增强了模型的可解释性。实验结果表明,在Urbansound8K数据集中,该模型可获得80.2%的分类准确率,这优于以前在同一数据集的报告结果  相似文献   

2.
针对现有神经网络车辆荷载识别方法的识别精度不足且训练样本采集困难的问题,提出了一种基于应变信号时频分析与CNN网络的车辆荷载识别方法,对移动车辆总重进行荷载识别.首先,利用连续小波时频变换方法处理桥梁跨中应变信号,得到应变信号的时频特征,并利用双线性插值算法将时频信号矩阵变为大小为64×64的数值矩阵,作为CNN网络的输入数据;其次,利用CNN网络的回归学习算法,在训练少量数值矩阵后直接建立应变响应与车辆荷载的映射关系,从而实现对未知车辆荷载的识别;最后,通过模拟试验发现虽然在不同路面粗糙度和噪声影响下,CNN网络的荷载识别结果会受到不同程度的影响,但在一定范围内的路面粗糙度和噪声影响下仍然能较精确地识别车辆荷载.  相似文献   

3.
针对视点、外观等因素变化给地点识别应用带来的不利影响,设计了1种基于显著路标及深度特征的地点识别方法.首先分割图像中的显著物体作为候选路标;然后设计YOLOv3算法网络,对候选路标进行识别,以删除不适合环境建模的特定对象类型;最后在图像相似度测量中,利用中层卷积层的性能特点,提取候选路标的卷积神经网络(convolutional neural networks,CNN)特征,并结合降维操作,提升匹配效率.在3个具有挑战性的公开数据集上进行了试验,与FAB-MAP、SeqSLAM和Place-CNN等先进方法进行了比较,该方法的平均识别精度达到71.22%,优于其他3种方法,表明经过筛选的显著路标的CNN特征可以抵御强烈的视点和外观变化.  相似文献   

4.
现有低分辨雷达目标识别通常采用先特征提取、再进行目标分类的两步识别算法,存在识别率难以提高和方法泛化性不足的问题,因此提出了一种基于卷积神经网络(CNN)的低分辨雷达目标一步识别算法。该算法直接将采样数据作为输入,利用设计的一维CNN,通过卷积池化等操作自动获取数据深层本质特征,无需特征提取,实现对目标的一步识别。仿真实验结果表明:基于CNN的低分辨雷达目标一步识别方法的识别率较传统基于提取特征的两步识别方法提高了10.31%,识别时间较传统两步识别方法减少了0.142 s,充分证明了一步识别方法的有效性,为低分辨雷达目标识别问题提供了新的解决途径。  相似文献   

5.
姜琦  冯庆胜 《科学技术与工程》2022,22(16):6680-6686
为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient, MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(convolutional neural network, CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。将S700K型转辙机在4种状态下运行时采集的真实声音信号进行训练和测试。结果表明:多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比(signal-to-noise ratio, SNR)下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。  相似文献   

6.
针对手写汉字中相似汉字的识别问题,构建了一种卷积神经网络(CNN)模型,并给出了其网络拓扑结构,通过随机弹性形变对样本集进行扩展,以提高模型的泛化性能.相似手写汉字的识别实验结果表明:相对于常规的CNN模型,文中CNN模型的手写汉字识别正确率提高1.66%,特别是对于变形的手写汉字,识别正确率提高12.85%;相对于传统的手写汉字识别方法,文中方法的识别错误率降低36.47%,从而验证了文中识别方法的有效性.  相似文献   

7.
基于深度图像和表观特征的手势识别   总被引:1,自引:0,他引:1  
针对复杂环境下的手势快速识别问题,提出一种基于深度图像信息和表观特征的手势识别方法.首先利用深度图像信息从复杂环境中快速提取手势区域;然后综合手势的表观特征,建立分类决策树实现手势的识别.针对常见的8种手势在复杂背景条件下进行测试,在机器人平台下手势的平均识别率高达98.2%,速度达到25帧/s.  相似文献   

8.
目前桥梁健康监测系统普遍存在数据量过大无法高效分析的缺点。为了改善健康监测系统数据灾难问题,本文提出基于卷积神经网络(CNN)的桥梁损伤识别方法。通过简支梁振动试验,取得9个测点加速度数据训练CNN,测试网络识别准确率,分析CNN在桥梁损伤识别应用中的有效性。在此基础上分析各种激励大小对CNN桥梁损伤识别影响,以及模拟真实环境在信号中添加噪声测试CNN性能。结果表明:CNN具有在噪声环境以及弱激励环境下良好的损伤识别性能。本文方法的阶段性试验成果能为桥梁监测系统数据灾难问题提供新的解决思路。  相似文献   

9.
针对使用单一信号分类的现有车辆识别技术的不足,提出了一种基于声音信号与振动信号协同表示的车辆分类识别方法.利用梅尔倒谱系数(MFCC)提取车辆的声音信号和振动信号特征,分别对提取的2种信号特征进行多任务训练分类,以获得多任务协同表示的重构误差并对其进行加权处理,得出被检测目标的分类识别结果.结果表明,所提出的车辆分类识别方法对于车辆目标具有较好的分类效果和较高的识别效率.  相似文献   

10.
车辆行驶时的声音主要由发动机噪声、轮胎噪声、空气涡流噪声、排气噪声组成,多个车辆构成的交通噪声取决于道路的交通流状态.在分析现有交通状态识别方法和车辆声音特性的基础上提出了一种利用交通噪声的交通状态识别方法.按照车速将交通流分为自由流、饱和流和交通拥堵3种状态,对不同交通流状态下的交通噪声信号进行谱分析,以归一化的峰值频率作为特征,用支持向量机对不同的交通流状态进行识别.试验结果表明,通过交通噪声能够正确识别不同的交通流状态,具有较高的识别精度.  相似文献   

11.
针对卷积神经网络(CNN)在交通标志识别过程中出现的梯度弥散而引起的识别率低的问题,给出了基于改进CNN结构的交通标志识别方法.实验结果表明:该方法能够有效提高识别精度,防止梯度弥散.  相似文献   

12.
针对杂草的精确喷洒问题提出一种基于卷积神经网络(Convolution Neural Network, CNN)的棉花植株和杂草的检测识别方法。首先采集不同环境下棉田中棉花植株和不同种类的杂草图像作为网络模型的数据集,对数据集进行数据增强来增加数据集的数量,将其分为训练集与测试集;然后构建CNN模型,在模型中添加Dropout层,以防止网络出现过拟合,将训练集数据输入网络模型,使模型学习棉花植株和杂草的特征信息;最后将测试集数据输入CNN模型,测试CNN模型对棉花植株和杂草的识别能力。研究结果表明CNN对于棉花植株和杂草的分类结果精度超过了99.95%,识别时间为197.2s,证明CNN可以快速高效的识别棉田中棉花植株和杂草,为农业智能精确除草装备的研发提供研究基础。  相似文献   

13.
传统的识别技术需要对图像进行大量预处理,以避免复杂背景、光照及图像扭曲等问题所带来的影响。文章基于卷积神经网络,通过面部图像到欧式空间的映射来作为人脸的距离特征向量,与给定设置的阈值进行比较,从而实现人脸识别任务。通过基于OpenCV的实验验证,基于特征距离的卷积神经网络(CNN)人脸识别方法对不同人脸特征和非限制因素影响下的人脸识别有较好的识别能力,是一种简化图像预处理工作的快速识别方法。  相似文献   

14.
提出一种基于卷积神经网络(Convolution Neural Network,CNN)的高分辨率雷达目标识别方法.首先针对小样本应用于深度CNN时训练过程中损失函数值收敛速度慢的问题,利用结合批归一化算法的改进CNN网络对高分辨距离像(High Resolution Range Profile,HRRP)进行自动特征提取;再利用支持向量机(Support Vector Machine,SVM)对距离像特征进行分类.使用军事车辆高保真电磁仿真数据对提出的方法进行验证,识别结果证明了该方法的有效性.  相似文献   

15.
针对步态识别问题,研究了受限玻尔兹曼机的步态特征提取及其识别.主要基于行人图像序列,通过背景分割、归一化以及步态周期的计算,采用叠加方法生成步态能量图,以此作为步态的特征图像,利用受限玻尔兹曼机自动获取步态特征.选取中科院CASIA步态数据库以及支持向量机、孪生支持向量机、神经网络与K-近邻方法对使用受限玻尔兹曼机方法的特征提取进行了研究,同时与主成分分析PCA、线性判别分析LDA、卷积神经网络CNN特征提取与识别方法进行了比较.  相似文献   

16.
基于复合结构分类器的人耳识别   总被引:4,自引:0,他引:4  
在基于独立分量分析的人耳识别方法研究基础上,提出复合结构分类器的人耳识别通用模型. 该模型首先根据人耳的几何特征对人耳进行粗分类;然后应用独立分量分析的方法提取代数特征,支持向量机进行细分类,最后给出分类结果. 这与人类由粗到细的识别过程是相符合的,能够克服单一独立分量分析识别方法的特征提取时间过长、特征数过多的缺点,同时避免了归一化过程中丢失比例结构特征的问题. 实验结果表明,该模型取得了较高的识别率,尤其适用于规模大的复杂人耳库.  相似文献   

17.
针对电话语音性别检测存在识别准确率较低的问题,提出了一种有效的电话语音性别检测方案(CNN+SVM); 首先,采用卷积神经网络(Convolutional Neural Network, CNN)提取幂律归一化倒谱系数(Power-Normalized Cepstral Coefficient, PNCC)的有效信息;然后, 结合优化后的基频特征,选用支持向量机(Support Vector Machine, SVM)实现性别分类.该方案有效融合了男、女发音和听觉感知特性上的差异,同时利用了CNN特征提取能力以及SVM鲁棒分类能力.仿真结果表明:CNN+SVM方案针对实际场景电话语音数据集的性别识别准确率优于传统识别方法.  相似文献   

18.
多模态生物识别可以弥补单模态生物识别存在的缺陷,已成为目前生物识别研究的主流趋势.现有的多模态生物识别大都使用传统的机器学习方法,而以深度学习为代表的新一代人工智能方法在该领域的应用研究相对较少.因此,提出了一种端到端、可训练的卷积神经网络(Convolutional Neural Network,CNN)模型用于多模态生物特征识别,并从单模态和多模态两方面研究模型结构和融合方式对识别性能的影响.在单模态识别中,研究不同网络层数和卷积核对识别性能的影响,并利用单模态识别的结果确定多模态识别的网络结构;在多模态识别中,为研究不同阶段特征融合对识别性能的影响,设计了两种不同的CNN结构;基于3种不同的融合方法,探索单层特征融合和双层特征融合机制对识别性能的影响,并通过组合优化给出一种最优的深度模型结构.为了评估本文方法的性能,分别在AR、Yale、Extended YaleB、LFW、PolyU和CASIA V1.0等6个标准数据库上进行验证.试验结果表明,基于CNN的单模态识别方法优于传统机器学习方法,本文提出的方法能够胜任单模态或多模态生物识别任务.  相似文献   

19.
连续手语识别相对于单个手语词识别来说,更加具有研究意义也更加具有研究难度.连续手语识别需要更关注整体语句在时间上的依赖关系,以及语句中手语词结束与开始的时序分割问题.而对此的单个识别算法的研究与优化,短时间都很难再有较大的突破.因此,我们提出一种基于算法融合的连续手语识别方法,先通过帧间差分法处理关键帧,再通过MediaPipe检测并保存关键点数据,降低数据量,并提供有效、直接的数据;再通过CNN+BLSTM算法融合模型,让CNN专注局部感知,捕捉空间特征关系;BLSTM则侧重特征序列的时序建模,突出连续手语在时间纬度上的依赖关系.最后结合CTC完成标签和语句对齐问题.该算法在CSL数据集上取得了98.4%的平均识别率.  相似文献   

20.
针对嘈杂背景、混叠、间断或多源的复杂音频,传统音频识别存在一定的局限性。文章提出了一种基于声谱图显著性检测的音频识别方法,将音频可视化转化为二维声谱图图像,利用图像的显著性检测有效获得声谱图中的主声源区域,并去除声谱图中与主声源无关的信息;然后针对主声源区域提取特征,以减少干扰并降低冗余度;采用改进的卷积神经网络(convolutional neural network,CNN)实现音频识别。实验结果表明,该方法可以有效解决复杂音频的识别问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号