首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
提出了一种新颖的语音情感识别结构,从声音文件中提取梅尔频率倒谱系数(Melscale frequency cepstral coefficients,MFCCs)、线性预测倒谱系数(linear predictive cepstral coefficients,LPCCs)、色度图、梅尔尺度频谱图、Tonnetz表示和频谱对比度特征,并将其作为一维卷积神经网络(convolutional neural network,CNN)的输入.构建由一维卷积层、Dropout层、批标准化层、权重池化层、全连接层和激活层组成的网络,并使用Ryerson情感说话/歌唱视听(Ryerson audio-visual database of emotional speech and song,RAVDESS)数据集、柏林语音数据集(Berlin emotional database,EMO-DB)、交互式情绪二元运动捕捉(interactive emotional dyadic motion capture,IEMOCAP)数据集这3个数据集的样本来识别情感.为提高分类精度,利用增量方法修改初始模型.为...  相似文献   

2.
复杂电能质量扰动的智能分类对于智能电网发展具有重要意义。扰动特征的提取与定位、模式识别与分类是电能质量扰动分类方法研究的难点。本文采用深度学习算法,将具有关注全局信息的Transformer与善于提取局部特征的卷积神经网络相融合,提出了一种基于卷积神经网络与Transformer的电能质量扰动分类方法,即CTranCBA。这种双深度学习模型分类方法主要是通过一维卷积神经网络提取电能质量扰动信号特征,利用Transformer自注意力机制引导模型关注序列中不同位置间的依赖关系,实现对扰动信号局部特征与全局特征的互补,克服了因感受野的限制而带来的识别不清、分类不准等问题。本文使用了23种不同电能质量扰动信号,将CTranCBA与Deep-CNN、CNN-LSTM、CNN-CBAM方法进行比较,结果表明该方法在分类准确率和抗噪性方面表现优异,可为电能质量扰动智能分类提供一种新的方法。  相似文献   

3.
为了获取老年人的精神状态从而更全面地了解老年人的身体状况,提出了基于多通道卷积注意力机制的精神状态识别方法。首先,对多种生理信号进行数据预处理,将不同采样频率的传感器数据进行重采样操作,保证数据长度一致。其次,根据输入信号的结构特征以及信号的长度设计对应卷积模块,使用4个不同大小的一维卷积核同时对信号进行特征提取,以增强模型的特征提取能力。再次,将卷积结果进行拼接,对拼接结果进行最大池化操作增加模型的感受野,在提取局部特征信号的同时实现信号间的长距离特征表达。最后,实验结果表明,总体分类准确率为99.75%,所提方法优于对比方法。  相似文献   

4.
在特定目标情感分析中,现有的循环神经网络模型存在训练时间长且获取目标相关信息困难的问题。针对该问题,利用注意力机制,提出一种带有位置嵌入的多头注意力门控卷积网络(PE-MAGCN)。首先,模型使用多头注意力层获取目标词与上下文词之间的信息,并额外加入文本和目标词的相对位置嵌入信息,然后采用带有门控机制的卷积神经网络提取与目标词有关的情感特征,最后通过Softmax分类器来识别情感极性倾向。使用SemEval 2014数据集与目前主要用于目标情感识别的模型进行实验对比,结果表明本模型的准确率和F1值较高,可以较好地完成特定目标情感分析任务。  相似文献   

5.
杨磊  赵红东 《科学技术与工程》2020,20(33):13757-13761
环境声音识别(Eenvironment Ssound Rrecognition ,ESR)在基于情景感知和辅助技术等领域发挥着重要作用。卷积神经网络(CNN)和循环神经网络(RNN)作为两种最具代表性的特征提取方法,在语音和音乐信号处理方面都取得显著效果,然而二者都存在一定缺点,CNN无法有效提取时间特征,RNN在提取空间特征上也存在明显劣势。为了有效的提取并利用时间特征和空间特征,提出一种新模型,利用时间分布卷积神经网络(CNN)从梅尔频谱图中提取城市环境声音特征,然后应用双向长短时记忆网络(BiLSTM)从CNN输出中获取时间信息,最后在BRNN的输出序列上实施注意力机制,从而关注到与城市环境声音最相关的特征进而做出分类判断,注意力机制既提高了分类准确性,又增强了模型的可解释性。实验结果表明,在Urbansound8K数据集中,该模型可获得80.2%的分类准确率,这优于以前在同一数据集的报告结果  相似文献   

6.
新冠肺炎在全球范围内的突然爆发,使医疗工作者进入了紧张的工作状态.面临此次突发的危机争件,病毒检测速度较慢,检测手段单一等问题也迅速暁露出来,为此,提出了一种基于注意力机制的轻量级卷积神经网络方法,以进行高效肺部图像分类,从而缓解医疗工作压力.提出模型采用MobileNet为基本网络,并融合注意力机制.实验表明,提出网...  相似文献   

7.
远程监督通过已有知识库的关系三元组和自然语言文本语料库进行启发式匹配,获得数据来完成关系抽取任务,解决有监督学习方法完全依赖人工标注数据的问题,但远程监督数据中会存在大量噪声关系标签.针对以上问题,提出了一种结合自注意力机制和分段卷积神经网络的实体关系抽取模型SAPCNN,首先通过自注意力机制捕获词与词之间的全局相关性...  相似文献   

8.
9.
针对现有的虚假评论检测方法未充分利用虚假评论文本特征这一问题,本文提出一种基于多层注意力机制的卷积神经网络模型。首先,使用多种预训练词向量初始化词嵌入层,并进行复值位置编码;然后,将经过多种卷积核卷积得到的多种特征映射依次通过嵌入用户特征的通道级和卷积核级的注意力层,根据特征重要程度分配不同权重;最后,将拟合的评论文本特征表示进行Softmax分类。实验结果表明,与诸多主流优秀神经网络模型相比,本文模型准确率和F1值分别提高4.74和3.86个百分点。  相似文献   

10.
单词级别的浅层卷积神经网络(CNN)模型在文本分类任务上取得了良好的表现.然而,浅层CNN模型由于无法捕捉长距离依赖关系,影响了模型在文本分类任务上的效果.简单地加深模型层数并不能提升模型的效果.本文提出一种新的单词级别的文本分类模型Word-CNN-Att,该模型使用CNN捕捉局部特征和位置信息,利用自注意力机制捕捉长距离依赖.在AGNews、DBPedia、Yelp Review Polarity、Yelp Review Full、Yahoo! Answers等5个公开的数据集上,Word-CNN-Att比单词级别的浅层CNN模型的准确率分别提高了0.9%、0.2%、0.5%、2.1%、2.0%.  相似文献   

11.
焊接是一种重要的连接技术,但是焊缝缺陷会直接影响焊接结构的性能和使用寿命。焊缝缺陷的种类和特征的多样性增加了缺陷检测的复杂性。首先,提出一种新颖的并行残差注意力模块,在通道和空间维度上充分利用全局平均池化和全局最大池化来捕获全局特征,并与输入特征相乘,自适应的选择缺陷特征,显著提升了网络模型的特征表达能力。其次,针对焊缝缺陷长宽比悬殊的问题,利用注意力机制指导锚框自学习图像特征,预测锚框的位置和形状,围绕缺陷区域自适应生成非均匀分布的任意形状的感兴趣区域。最后,设计了端到端的由注意力引导感知的深度学习网络模型。为验证所提模型的有效性,在包含3 403张图像(其中1 001张有缺陷)的X射线焊缝数据集上,通过定性的分析和定量的对比。实验结果表明:检测指标平均精度均值(mean average precision, mAP)达到了66.74%,与原算法相比提升了5.78%,平均交并比(mean intersection over union, mIoU)提升了7.21%,基本满足对焊缝缺陷的高精度检测。  相似文献   

12.
环境和荷载协同作用导致的路面病害对道路使用性能和安全性能的影响日益突出。现有图像智能识别算法难以实现处理速度和计算量的平衡。针对道路病害快速准确实时识别的需求,对石家庄损伤较为严重的路面进行实地拍照,结合已有图片,采用数据增强技术构建了市政道路病害数据集,并且提出了一种基于MobileNetV3网络的轻量化道路病害识别网络模型GEM-MobileNetV3。该模型首先使用Ghost模块代替MobileNetV3网络基本单元中的1×1卷积;然后结合改进后的高效通道注意力机制ECA模块提取病害目标的重要特征;最后将网络浅层的ReLU激活函数替换为泛化能力更强的Mish激活函数,提高模型的整体性能。通过消融实验与对比实验,验证了新模型的有效性。实验结果表明,新模型准确率达到96.33%,其参数量与计算量较MobileNetV3模型分别降低了37.9%和36%。提出的新模型在保持较高识别准确率的同时有效降低了模型复杂度,为在低成本计算平台上实现高准确率实时识别提供了新途径。  相似文献   

13.
为了节约传输带宽和存储资源,成像设备和系统一般对图像和视频进行了有损压缩. 由于分块量化编码,JPEG图像往往存在明显的块效应. 去除图像的块效应不仅能够改善使用者的视觉体验,还有利于其他计算机视觉任务的开展. 为此,本文提出了一种基于多尺度宽激活残差注意力网络(MWRAN)的图像去块效应方法. MWRAN主要由多尺度宽激活残差注意力模块(MWRAB)构建而成. 提出的MWRAB不仅能够激活更多的非线性特征以促进信息在网络中的流动,还能够捕获丰富的图像多尺度特征. 此外,通过提出的轻量的差异感知通道注意力(LCCA),MWRAB能够对学习到的特征进行自适应地调整以关注更重要的信息. 消融实验验证了MWRAB的有效性. 在常用的基准数据集上,MWRAN取得了比几种先进的图像去块效应方法更高的客观评价指标和更接近原图的主观视觉效果.  相似文献   

14.
郭赟  张剑妹  连玮 《科学技术与工程》2020,20(14):5688-5695
学习注意力是学生学习效率的一个重要因素,直接影响学生的学习效果。为了有效监测学生在传统课堂教学中的注意力情况,提出一种基于头部姿态识别的学生注意力判别方法。首先运用卷积神经网络对视频图像的面部特征点进行检测,其次采用比例正交投影迭代变换(pose from orthography and scaling with iterations,POSIT)算法对人脸进行跟踪识别,并对人脸的旋转角度进行计算,根据其头部的倾斜角度对学生注意力进行分析研究。测试结果表明,提出的模型注意力检测准确率为88.7%,可以有效地对学生注意力进行检测,具有较好的应用前景。  相似文献   

15.
基于BP神经网络的实践教学质量评价模型研究   总被引:1,自引:0,他引:1  
该文利用反向传播(Back Propagation,BP)神经网络建立实践教学质量评价模型。将实践教学质量评价指标量化为确定的数据作为其输入,实践教学质量作为输出。运用Excel进行实证研究,发现将该方法运用于实践教学质量评价中,较好的模拟了评价专家进行综合评价的过程,得到了满意的评价结果。  相似文献   

16.
针对低质量人脸图像阻碍识别系统性能提升的问题,本文提出了一种无参考的人脸图像质量评价方法,并使用该方法评估了不同类型的图像退化对人脸图像质量的影响程度.该方法使用一种集群卷积网络结构,模拟人脸图像退化过程中的特征偏移,根据特征偏移量和图像信息量之间的相关性,完成人脸图像质量分数计算.使用遗传算法对构成集群网络的网络单元进行筛选,可使用更小网络规模实现同等性能.以质量评价算法为工具进行实验,研究评估了不同图像退化类型对人脸识别的影响,为指导今后人脸质量相关研究得出了有益结论.在主流人脸数据集上进行的实验证明,通过筛选数据库中低质量分数的人脸图像,可以进一步提升现有人脸识别系统的性能,且识别率提升表现出良好稳定性.该方法复杂度低,无需训练,与FaceQNet等最新方法相比,在FNMR和EER指标上显示出明显优势.  相似文献   

17.
人群间的相互遮挡和多变的空间尺度是基于单幅图像人群计数算法面临的主要挑战.近年来,基于深度学习的人群计数算法在该问题上取得了显著的成效,然而越来越深的网络结构给模型的训练和应用带来了困难.为了解决上述问题,提出了一种基于多尺度融合卷积神经网络(multi-scale fusion convolution neural ...  相似文献   

18.
时间型网络隐蔽信道是一种隐蔽性极高的信息泄露方式.其作为APT攻击的主要通信手段,对网络安全产生了极大威胁.目前针对隐蔽信道的检测方法通用性不足、误检率高,且人工提取流量特征耗时耗力.本文提出了一种基于灰度图像转化的检测方法.该方法将报文到达时间间隔归一化,转换成像素值,再将其转为灰度图像,由此把一维序列分类问题转成二维图像分类问题.本文使用卷积神经网络自动获取图像特征,并利用卷积块注意力模块,从空间与通道两个维度进行特征自适应优化.本文用合法流量和隐蔽信道流量组成的数据集训练网络,所得到的二分类模型用于判别被检测流量是否为时间型隐蔽信道流量.最后将提出的方法与现有的4种检测方法做对比.实验结果表明,本文方法具有更高的精确率和召回率,所得模型的通用性更好且误检率更低.  相似文献   

19.
为了提高卷积神经网络(CNN)的泛化性和鲁棒性,改善无人机航行时识别目标图像的精度,提出了一种CNN与概率神经网络(PNN)相结合的混合模型。利用CNN提取多层图像表示,使用PNN提取特征对图像进行分类以替代CNN内部的BP神经网络,采用均方差和降梯度法训练模型,通过将预处理的图像传输到CNN-PNN模型,对图像纹理和轮廓进行分类识别,并将此模型的仿真结果与卷积神经网络模型、卷积神经网络-支持向量机模型的结果进行对比。仿真结果表明,与其他两种模型相比,CNN-PNN模型具有更好的精准度,识别率高达96.30%。因此,CNN-PNN模型能够快速有效地识别图像,准确度和实时性较高,在图像识别等方面具有很好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号