首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于二阶差分MFCC深度学习的声景基调声分类方法
引用本文:邓志勇,张万亿,刘爱利.基于二阶差分MFCC深度学习的声景基调声分类方法[J].中国传媒大学学报,2023(5):26-35+54.
作者姓名:邓志勇  张万亿  刘爱利
作者单位:1. 首都师范大学音乐学院;2. 中央音乐学院音乐人工智能与音乐信息科技系;3. 首都师范大学资源环境与旅游学院
基金项目:北京社科基金重点项目(22GLA014);;国家自然科学基金面上项目(41871130);
摘    要:本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。

关 键 词:声景  基调声  卷积神经网络  二阶差分MFCC
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号