首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进型BP神经网络的音频多分类
引用本文:刘军伟,余小清,万旺根,张静,杨薇. 基于改进型BP神经网络的音频多分类[J]. 上海大学学报(自然科学版), 2012, 18(2): 127-131
作者姓名:刘军伟  余小清  万旺根  张静  杨薇
作者单位:上海大学 通信与信息工程学院,上海 200072
基金项目:国家自然科学基金资助项目(60872115);上海市教委重点学科建设资助项目(J50104)
摘    要:音频信号作为多媒体信息的重要载体之一, 为满足人们对信息知识的获取提供了有效途径.为了提高音频分类的精度,提出一种将音频信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)参数作为特征向量,采用基于改进型传输函数的误差反向传播神经(back propagation, BP)网络模型对6种音频进行分类.实验证明,该方法在音频分类精度方面性能良好,改进的传输函数具有收敛速度快的优点.相对于传统BP算法,该方法不仅缩短了训练时间,而且进一步提高了分类精度,其分类准确率达到90%以上.

关 键 词:BP神经网络  传输函数  分类精度  收敛速度  音频分类  

Multiple Classification of Audio Based on Improved BP Neural Network
LIU Jun-wei,YU Xiao-qing,WAN Wang-gen,ZHANG Jing,YANG Wei. Multiple Classification of Audio Based on Improved BP Neural Network[J]. Journal of Shanghai University(Natural Science), 2012, 18(2): 127-131
Authors:LIU Jun-wei  YU Xiao-qing  WAN Wang-gen  ZHANG Jing  YANG Wei
Affiliation:(School of Communication and Information Engineering, Shanghai University, Shanghai 200072, China)
Abstract:Audio is an important medium that carries substantial information to meet human needs.To improve accuracy of audio classification,we propose a new algorithm with Mel frequency cepstrum coefficient(MFCC) parameters as the feature vectors,and use a back propagation(BP) neural network model based on improved transfer function to classify six types of audio signals.Experiments show that the proposed algorithm has good performance and the improved transfer function converges faster that the traditional BP algorithm.It can reduce training time,and improve classification accuracy up to more than 90%.
Keywords:transfer function  BP neural network  convergence speed  audio classification  classification accuracy
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《上海大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《上海大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号