基于增量方法的卷积语音情感识别网络期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于增量方法的卷积语音情感识别网络

作者姓名：	朱永华冯天宇张美贤张文俊

作者单位：	上海大学上海电影学院, 上海 200072

摘要：	提出了一种新颖的语音情感识别结构,从声音文件中提取梅尔频率倒谱系数(Melscale frequency cepstral coefficients,MFCCs)、线性预测倒谱系数(linear predictive cepstral coefficients,LPCCs)、色度图、梅尔尺度频谱图、Tonnetz表示和频谱对比度特征,并将其作为一维卷积神经网络(convolutional neural network,CNN)的输入.构建由一维卷积层、Dropout层、批标准化层、权重池化层、全连接层和激活层组成的网络,并使用Ryerson情感说话/歌唱视听(Ryerson audio-visual database of emotional speech and song,RAVDESS)数据集、柏林语音数据集(Berlin emotional database,EMO-DB)、交互式情绪二元运动捕捉(interactive emotional dyadic motion capture,IEMOCAP)数据集这3个数据集的样本来识别情感.为提高分类精度,利用增量方法修改初始模型.为...
关键词：	语音情感识别卷积神经网络注意力机制
收稿时间：	2021-03-20

	点击此处可从《上海大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《上海大学学报(自然科学版)》下载全文