基于多任务深度特征提取及MKPCA特征融合的语音情感识别 |
| |
引用本文: | 李宝芸,张雪英,李娟,黄丽霞,陈桂军,孙颖.基于多任务深度特征提取及MKPCA特征融合的语音情感识别[J].太原理工大学学报,2023(5):782-788. |
| |
作者姓名: | 李宝芸 张雪英 李娟 黄丽霞 陈桂军 孙颖 |
| |
作者单位: | 太原理工大学信息与计算机学院 |
| |
基金项目: | 国家自然科学基金资助项目(61371193);;山西省回国留学人员科研资助项目(HGKY2019025); |
| |
摘 要: | 【目的】针对传统声学特征所含情感信息不足的问题,提出一种基于多任务学习的深度特征提取模型优化声学特征,所提声学深度特征既能更好表征自身又拥有更多情感信息。【方法】基于声学特征与语谱图特征之间的互补性,首先通过卷积神经网络提取语谱图特征,然后使用多核主成分分析方法对这两个特征进行特征融合降维,所得融合特征可有效提升系统识别性能。【结果】在EMODB语音库与CASIA语音库上进行实验验证,当采用DNN分类器时,声学深度特征与语谱图特征的多核融合特征取得最高识别率为92.71%、88.25%,相比直接拼接特征,识别率分别提升2.43%、2.83%.
|
关 键 词: | 语音情感识别 多任务学习 声学深度特征 语谱图特征 多核主成分分析 |
|
|