首页 | 本学科首页   官方微博 | 高级检索  
     检索      

声码器半解码参数用于说话人身份确认
引用本文:李晓先,戴蓓蒨,李辉.声码器半解码参数用于说话人身份确认[J].中国科学技术大学学报,2005,35(4):523-529.
作者姓名:李晓先  戴蓓蒨  李辉
作者单位:中国科学技术大学电子科学与技术系,安徽合肥,230026
基金项目:国家自然科学基金(6027039)和安徽省自然科学基金(01042205)资助项目.
摘    要:面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码—特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(ANN-WB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMM-UBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性.

关 键 词:话者确认  半解码参数  基音频率  GMM-UBM  AMR-WB编码
文章编号:0253-2778(2005)04-0523-07
收稿时间:2004-03-23
修稿时间:2004年3月23日

Research on Speaker Verification With Half-Decoded Parameters of Vocoder
LI Xiao-xian,DAI Bei-qian,LI Hui.Research on Speaker Verification With Half-Decoded Parameters of Vocoder[J].Journal of University of Science and Technology of China,2005,35(4):523-529.
Authors:LI Xiao-xian  DAI Bei-qian  LI Hui
Abstract:A feature extraction method is designed for linear predict vocoders widely used in the communication field. In this method, feature vectors are extracted not from the decoded waveform, but from the bit stream of transmission directly. Specifically for Wideband Adaptive Multi Rate vocoder (AMR-WB), we implemented a text-independent speaker verification system. Which employs the probability-statistics-based GMM-UBM framework as speaker model and takes LPC cepstrum and pitch derived parameters as feature vectors. Experiments indicate that the half-decoded based system, which runs ten times faster than the decoded-based system, is capable of similar performance to the latter, and shows robustness for code rate mismatch of AMR-WB.
Keywords:speaker verification  half-decoded parameter  pitch  GMM-UBM  AMR-WB codec
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号