基于二阶差分MFCC深度学习的声景基调声分类方法 |
| |
引用本文: | 邓志勇,张万亿,刘爱利.基于二阶差分MFCC深度学习的声景基调声分类方法[J].中国传媒大学学报,2023(5):26-35+54. |
| |
作者姓名: | 邓志勇 张万亿 刘爱利 |
| |
作者单位: | 1. 首都师范大学音乐学院;2. 中央音乐学院音乐人工智能与音乐信息科技系;3. 首都师范大学资源环境与旅游学院 |
| |
基金项目: | 北京社科基金重点项目(22GLA014);;国家自然科学基金面上项目(41871130); |
| |
摘 要: | 本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。
|
关 键 词: | 声景 基调声 卷积神经网络 二阶差分MFCC |
|
|