首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于GMM全统计参数和SVM的文本无关话者确认   总被引:1,自引:0,他引:1  
针对电话语音条件下的文本无关话者确认,提出了一种基于GMM(Gaussian mixturemodel)全统计参数和SVM(support vector machine)的话者确认方法,以克服语音特征参数直接建立SVM话者模型面临的困难.该方法使用由GM(general model)自适应均值得到的GMM提取统计参数,定义了一种合理利用全部统计参数的特征参数,并以此参数及线性核函数建立了具有良好性能的SVM话者模型.与GMM-UBM方法及另一种基于GMM统计参数和SVM的方法在NIST05SRE数据库中的实验比较,结果表明基于GMM全统计参数和SVM的话者确认方法拥有优异的性能.  相似文献   

2.
在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。  相似文献   

3.
4.
短时声纹识别中语言属性不匹配问题降低了话者识别系统性能,语言属性失配在短时话者识别中的影响成为当前研究热点。从消除特征参数中的语言属性信息出发,提出了一种语言属性映射方法。采用均值超向量来构建训练样本,应用高斯混合模型对每一句话不等长的特征进行建模,引入加权矩阵得到语言属性空间,通过映射方法在统计参数超矢量空间中消除语言属性的影响。使用当前两套经典声纹识别系统作为基线系统做对比试验,结果表明:相对基线系统在等错误率上,男声测试部分降低了23.07%,女声测试部分降低了20.39%,从而验证了正确性和有效性。  相似文献   

5.
针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高.  相似文献   

6.
提出了一种新的注册者模型——“时间一空间分布模型(TSDM)”,传统GMM用参数表征训练矢量的空间分布,但舍弃了训练矢量间的时间联系信息,而TSDM利用基于GMM中均值矢量的高阶协方差矩阵,可向训练矢量的空间分布模型中引入一定程度的训练矢量间时间联系.还给出了TSDM的判据生成方法.实验表明,TSDM能在长训练语句时获得与传统GMM相当的识别性能,在短训练语句时表现得更优秀.  相似文献   

7.
针对说话人确认系统中GMM超向量建模计算复杂度高以及易受信道干扰的问题,提出一种新型的基于Bhattacharyya距离聚类的WCCN序列核函数算法.首先计算话者GMM模型之间的Bhattacharyya距离,根据该Bhattacharyya距离对话者模型进行聚类,得到聚类中心模型;紧接着对聚类中心模型的均值向量进行MAP自适应,进而生成超向量序列核函数;最后采用WCCN平滑归一化技术对序列核函数进行信道补偿,抑制噪音和信道畸变对核函数的影响.将该Bhattacharyya聚类WCCN核函数应用到SVM说话人确认系统,仿真实验结果表明该核函数可以有效地提高系统的识别准确率和识别速度.  相似文献   

8.
提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率.  相似文献   

9.
与文本无关的复合策略说话人辨识系统   总被引:4,自引:1,他引:4  
为获得较高的说话人辨识正确率,同时减小辨识系统的时空开销,提出了一种复合策略的辨识系统。采用长时平均频谱作为粗识的特征,定义了相应的辨识判别准则。建立mel-倒谱特征的高斯混合模型(GMM)进行第二步辨识。给出了GMM求解算法的一种简便推导,着重研究了判别阈值,预加重系数,GMM阶次,训练语音长度及辨识语音长度对系统辨识性能的影响。  相似文献   

10.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

11.
声码器半解码参数用于说话人身份确认   总被引:2,自引:0,他引:2  
面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码—特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(ANN-WB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMM-UBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性.  相似文献   

12.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

13.
该文提出鉴别式局部信息距离保持映射,以解决一类集合分类问题。鉴别式局部信息距离保持映射假设集合所对应的概率密度分布位于统计流形上,选取Fisher信息距离作为概率密度分布间的距离,并将最小化同类点的信息距离、最大化异类近邻点的信息距离作为目标函数,利用特征值分解的方法,求解线性映射矩阵。基于美国国家标准技术署于2008年公布的说话人识别数据库的实验结果表明:鉴别式局部信息距离保持映射优于无用分量投影和鉴别式无用分量投影。  相似文献   

14.
为了研究模糊聚类算法在高斯混合模型(GMM)参数获取方面的应用,采用模糊C均值算法(FCM)进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率.  相似文献   

15.
距离加权矢量量化文本无关的说话人识别   总被引:10,自引:0,他引:10  
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。  相似文献   

16.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

17.
为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。  相似文献   

18.
针对采用梅尔频率倒谱系数(mel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法。语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量。这些获取的身份认证向量经过线性判别性分析实现降维并存储。最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别。以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低。  相似文献   

19.
与文本无关的话者识别一般采用高斯混合模型(GMM),而AdaBoost算法是用于提高各种现有学习算法精度的一种通用的优化算法.论文中讨论如何应用AdaBoostGMM算法进行说话人识别.  相似文献   

20.
该文指出了常用的倒谱均值归一方法在去除信道因素的同时,也去掉了一些说话人的语音特征,因此,在信道失配的环境下鲁棒性较差。提出利用信道间差异,补偿信道失配的信道空间映射方法,并构建了一个与文本无关对随机信道鲁棒的说话人识别系统。实验结果表明:对来自随机信道的说话人语音,第1名和前30名的正确识别率,与实验室基线系统的性能比较,分别提高了5.4%和18.6%。寻找并补偿信道间的差异,是一种提高说话人识别鲁棒性的有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号