首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于掌上电脑录音的说话人辨认
引用本文:殷启新,韩春光,杨鉴.基于掌上电脑录音的说话人辨认[J].云南民族大学学报(自然科学版),2003,12(4):251-254.
作者姓名:殷启新  韩春光  杨鉴
作者单位:云南大学,信息学院,昆明,650091
基金项目:国家自然科学基金资助 ( 60 2 650 0 1) .
摘    要:说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。

关 键 词:语音信号处理  语音识别  说话人辨认  掌上电脑  语音数据库  高斯混合模型  特征矢量  EM算法
文章编号:1005-7188(2003)04-0251-04
修稿时间:2003年5月13日

Speaker Identification Based on Speech Corpus with PDA
YIN Qi-xin,HAN Chun-guang,YANG Jian.Speaker Identification Based on Speech Corpus with PDA[J].Journal of Yunnan Nationalities University:Natural Sciences Edition,2003,12(4):251-254.
Authors:YIN Qi-xin  HAN Chun-guang  YANG Jian
Abstract:Speaker identification is one of the parts of speech signal processing . Many experiments about text-independent speaker identification according to t he speech corpus recorded with PDA are described in this paper. In these experim ents, the GMM(Gaussian Mixture Model) is used to modeling speaker's features bas ed on LPCC(Linear Prediction Cepstrum Coefficient) parameters and the EM(Expecta tion-Maximization ) learning algorithm. Three alternatives in covariance matrix form of GMM and their correct rates are compared. The experimental result shows that the error rate is lowest when the covariance matrix is full.
Keywords:PDA  Speaker identification  GMM  EM algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号