排序方式: 共有44条查询结果,搜索用时 0 毫秒
21.
语音情感识别是人机交互、情感计算中重要的研究方向.目前普遍使用深度神经网络用于语音情感特征的提取,但使用哪种神经网络模型、如何缓解模型过拟合问题还需进一步研究.针对这些问题,提出了一种结合一维卷积(CNN)以及门控循环单元(GRU)的CGRU模型,从原始语音信号的MFCC特征中提取语音的低阶以及高阶情感特征,并通过随机森林对其进行特征选择,在三种公用的情感语料库EMODB,SAVEE,RAVDESS上分别取得了79%,69%以及75%的识别精度.通过添加高斯噪声及改变速度等方法来增加样本量实现数据扩充,进一步提高了识别精度.通过在线识别系统验证了模型在实际环境中的可用性. 相似文献
22.
基于惯性传感器的步态识别研究是人工智能应用到实际生活的典型范例,近几年取得满意的成就.针对日常生活中连续动作类型的信号,对其进行精确分割和识别的效果仍略有不足;这些研究局限于传感器信号的时域特征和一些简单的频域特征,且没有对不同动静状态的动作进行分类.将人类常见6种连续行为分为3类动态动作和3类静态动作,并对其进行分割和识别.使用滤波器去除原始信号噪声干扰.通过滑动窗口分割法进行分割,对每一个窗口片段提取常用传统特征和梅尔倒谱系数,以及倒谱系数的一二阶delta导数等频域特征.将6类动作的不同特征进行多种组合,使用分类器识别不同动作,将不同特征组合的识别结果进行比较.该模型在UCI公开数据集随机抽取了5组测试样本,整体分割识别准确率最高达到98.19%. 相似文献
23.
24.
随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,本文研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。 相似文献
25.
在复杂环境声场景识别任务中, 梅尔频谱作为输入的深度卷积神经网络有良好的识别能力, 然而梅尔滤波器组依据人耳生理特征设计, 对于声场景识别并非最优滤波器组。针对此问题提出声谱图提取神经网络取代传统梅尔频谱提取过程, 通过训练该网络使声谱图自动适应声场景数据集。声谱图提取神经网络连接ResNet50作为声场景识别架构, 在DCASE2019声场景数据集上进行训练与测试, 实验结果表明该架构比传统模型有更高的识别率, 能够有效调整频率曲线、滤波器幅值以及滤波器形状。 相似文献
26.
建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。 相似文献
27.
MFCC中的基音频率信息对说话人识别系统性能的影响 总被引:2,自引:0,他引:2
目前对MFCC的应用与研究,一般忽略了基音频率对MFCC的影响.分析发现,基音频率会影响MFCC对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC(smoothing MFCC),在YOHO说话人识别数据库上的实验表明,SMFCC性能在整体上优于MFCC,而在女性说话人数据集上性能提高尤其明显,并且具有更好的时间鲁棒性. 相似文献
28.
29.
为了识别大词汇量下连续长沙话方言语音,提出了基于CTC算法的门控线性单元神经网络模型.先通过梅尔倒谱系数提取语音的特征参数,再把提取的特征参数输入门控线性单元神经网络,用CTC算法进行训练优化,得到输入序列整个的预测标签.最后在自建的长沙话方言语料库上,以词错率作为评价指标,对CTC模型、GRU模型和CTC-GRU模型进行对比,结果表明CTC-GRU模型相对于其他2个模型收敛速度更快,结果更精准. 相似文献
30.
为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient, MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(convolutional neural network, CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。将S700K型转辙机在4种状态下运行时采集的真实声音信号进行训练和测试。结果表明:多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比(signal-to-noise ratio, SNR)下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。 相似文献