首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于变分辨率频谱特征的向量机静音检测和实时混音技术
引用本文:薛卫,都思丹,叶迎宪,方承志.基于变分辨率频谱特征的向量机静音检测和实时混音技术[J].中国科学技术大学学报,2006,36(8):898-901.
作者姓名:薛卫  都思丹  叶迎宪  方承志
作者单位:南京大学电子科学与工程系,江苏南京,210093
摘    要:静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.

关 键 词:静音检测  变分辨率频谱  支持向量机  短时自适应权重  混音
文章编号:0253-2778(2006)08-0898-04
收稿时间:06 14 2006 12:00AM
修稿时间:07 3 2006 12:00AM

Voice activity detection using multiresolution spectrum and support vector machines and audio mixing algorithm
XUE Wei,DU Si-dan,YE Ying-xian,FANG Cheng-zhi.Voice activity detection using multiresolution spectrum and support vector machines and audio mixing algorithm[J].Journal of University of Science and Technology of China,2006,36(8):898-901.
Authors:XUE Wei  DU Si-dan  YE Ying-xian  FANG Cheng-zhi
Institution:Department of Electronics Science and Engineering, Nanj ing University, Nanj ing 210093, China
Abstract:
Keywords:voice activity detection  multiresolution spectrum  support vector machine(SVM)  short-time adaptive weighted  speech mixing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号