首页 | 本学科首页   官方微博 | 高级检索  
     检索      

GMM-UBM和SVM说话人辨认系统及融合的分析
引用本文:鲍焕军,郑方.GMM-UBM和SVM说话人辨认系统及融合的分析[J].清华大学学报(自然科学版),2008,48(Z1):693-698.
作者姓名:鲍焕军  郑方
作者单位:鲍焕军(清华大学信息技术研究院,语音和语言技术中心,北京,100084);郑方(清华大学信息技术研究院,语音和语言技术中心,北京,100084)
摘    要:在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,sVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够.该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能.在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%.

关 键 词:说话人辨认  Gauss混合模型-通用背景模型(GMM-UBM)  支持向量机(SVM)  信道鲁棒
文章编号:1000-0054(2008)1-0693-06
修稿时间:2007年9月10日

Combined GMM-UBM and SVM speaker identification system
BAO Huanjun,ZHENG Fang.Combined GMM-UBM and SVM speaker identification system[J].Journal of Tsinghua University(Science and Technology),2008,48(Z1):693-698.
Authors:BAO Huanjun  ZHENG Fang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号