基于二阶差分MFCC深度学习的声景基调声分类方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于二阶差分MFCC深度学习的声景基调声分类方法

引用本文：	邓志勇,张万亿,刘爱利.基于二阶差分MFCC深度学习的声景基调声分类方法[J].中国传媒大学学报,2023(5):26-35+54.

作者姓名：	邓志勇张万亿刘爱利

作者单位：	1. 首都师范大学音乐学院;2. 中央音乐学院音乐人工智能与音乐信息科技系;3. 首都师范大学资源环境与旅游学院

基金项目：	北京社科基金重点项目（22GLA014）；;国家自然科学基金面上项目（41871130）；

摘要：	本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征，尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例，根据本文设计的网络模型结构，使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%，远优于单独使用RMS和Mel频谱特征，以及联合使用RMS与二阶差分MFCC特征的准确率。
关键词：	声景基调声卷积神经网络二阶差分MFCC