排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
在复杂环境声场景识别任务中, 梅尔频谱作为输入的深度卷积神经网络有良好的识别能力, 然而梅尔滤波器组依据人耳生理特征设计, 对于声场景识别并非最优滤波器组。针对此问题提出声谱图提取神经网络取代传统梅尔频谱提取过程, 通过训练该网络使声谱图自动适应声场景数据集。声谱图提取神经网络连接ResNet50作为声场景识别架构, 在DCASE2019声场景数据集上进行训练与测试, 实验结果表明该架构比传统模型有更高的识别率, 能够有效调整频率曲线、滤波器幅值以及滤波器形状。 相似文献
1