首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 31 毫秒
1.
针对说话人确认系统中GMM超向量建模计算复杂度高以及易受信道干扰的问题,提出一种新型的基于Bhattacharyya距离聚类的WCCN序列核函数算法.首先计算话者GMM模型之间的Bhattacharyya距离,根据该Bhattacharyya距离对话者模型进行聚类,得到聚类中心模型;紧接着对聚类中心模型的均值向量进行MAP自适应,进而生成超向量序列核函数;最后采用WCCN平滑归一化技术对序列核函数进行信道补偿,抑制噪音和信道畸变对核函数的影响.将该Bhattacharyya聚类WCCN核函数应用到SVM说话人确认系统,仿真实验结果表明该核函数可以有效地提高系统的识别准确率和识别速度.  相似文献   

2.
提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率.  相似文献   

3.
提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率.  相似文献   

4.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

5.
GMM-UBM和SVM说话人辨认系统及融合的分析   总被引:3,自引:0,他引:3  
在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,sVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够.该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能.在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30%和SVM系统的8.26%降低到7.34%,分别相对降低了21.08%和11.14%.  相似文献   

6.
该文指出了常用的倒谱均值归一方法在去除信道因素的同时,也去掉了一些说话人的语音特征,因此,在信道失配的环境下鲁棒性较差。提出利用信道间差异,补偿信道失配的信道空间映射方法,并构建了一个与文本无关对随机信道鲁棒的说话人识别系统。实验结果表明:对来自随机信道的说话人语音,第1名和前30名的正确识别率,与实验室基线系统的性能比较,分别提高了5.4%和18.6%。寻找并补偿信道间的差异,是一种提高说话人识别鲁棒性的有效方法。  相似文献   

7.
针对说话人确认识别率低且易受到信道干扰的问题,提出一种基于GMM超向量和Fisher判别准则的稀疏分类算法。该算法首先采用GMM通用背景模型生成说话人的GMM超向量,在超向量集上利用类内协方差归一化方法抑制信道的干扰信息,通过计算GMM超向量与整体训练样本集的Fisher判别比来选择更具区分度的语音特征向量,构建高判别性的稀疏性过完备字典。最后,在过完备字典上对语音GMM超向量进行重构,选择重构误差最小的类别作为目标说话人。仿真实验结果表明:Fisher判别准则在稀疏性过完备字典的构建过程中具有较好的特征选择优势,可以提高稀疏分类的准确性。  相似文献   

8.
为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混合模型之间的Kullback-Leibler距离度量构造的SVM序列核函数对超向量进行训练和判决.在美国国家标准与技术研究所(NIST)2004和2006年说话人识别数据库上的实验证明了该核函数能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性.结果表明,本文提出的应用于说话者确认系统中的核函数不仅具有明确的物理意义,而且改善了识别系统的性能.  相似文献   

9.
针对说话人确认识别率低及鲁棒性差的问题,提出一种基于多约简α-GMM和支持向量机的说话人确认算法.该算法首先采用主成分分析方法对语音特征向量降维,在约简向量集上为话者建立α-GMM模型,并根据模型间的KL散度进行聚类,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果.仿真实验结果表明该算法具有良好的鲁棒性和较高的识别率.  相似文献   

10.
由于噪声干扰问题,说话人识别算法的效率受到很大影响.为此,在美尔倒谱系数特征提取的基础上,采用半升正弦函数对特征进行修正.采用特征规整、特征弯折和特征映射三种方法对特征进行校对.为提高说话人识别率以及模型的鲁棒性,提出混合BP神经网络与混合高斯模型的方法,将高斯混合模型的概率输出作为神经网络输入,从而获取说话人间的交互信息.试验结果显示,算法的识别率高,抗噪性好.  相似文献   

11.
基于鉴别性i-vector局部距离保持映射的说话人识别   总被引:1,自引:0,他引:1  
为了进一步提高i-vector说话人识别系统的性能,该文提出了一种鉴别性i-vector局部距离保持映射(discriminant i-vector local distance preserving projection,DIVLDPP)的流形学习算法。该算法以i-vector间的Euclid距离作为度量准则,并以最小化同类点间距离同时最大化异类近邻点间距离的鉴别性准则作为优化目标函数,利用求解广义特征值的方法,得到最终的投影映射矩阵。在美国国家标准技术局2008年说话人识别核心数据集上的实验结果表明:该算法可以明显提高目前i-vector说话人识别系统的性能。  相似文献   

12.
针对采用梅尔频率倒谱系数(mel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法。语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量。这些获取的身份认证向量经过线性判别性分析实现降维并存储。最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别。以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低。  相似文献   

13.
以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(uni-versal background,UB)数...  相似文献   

14.
目前主流的说话人确认系统一般包括若干个分类器,或称子系统,通过对各分类器输出分数的融合得到最终的识别结果。该文针对说话人确认系统线性分数融合中的分类器筛选问题,提出了最小矢量角(VAM)筛选准则,将各分类器得到的分数拼接成矢量,在分数矢量空间中考察各矢量的几何学关系,然后选取一个最优的矢量子集,使得它们经过线性组合能够与实际情况对应的参考矢量夹角最小。为了控制搜索规模,在分类器选取方案的优化中,采用模拟退火算法得到近似最优解。实验结果表明,基于VAM的分类器选择可以在降低所需分类器数目的同时提高系统的性能。较之依据单分类器性能最优准则选择分类器,在选择分类器数量n=16的情况下,系统等错误率相对下降15%。  相似文献   

15.
为了建立一个数字串说话人身份确认系统 ,采用了基于数字HMM的与文本有关的身份确认方式 ;使用限定在数字范围内的任意数字串为语音文本 ,并内嵌能较好反映说话人特征的关键数字来提高确认性能 ;最终对多个关键数字的确认子系统进行综合判决 ,以提高HMM识别性能鲁棒性 .文中重点研究了基于关键数字HMM的身份确认 ,提出了以模型间的距离测度为准则来选择说话人的关键数字 ,并通过对比实验表明了用计算KLD上限的方法进行模型间距离测度的有效性 .  相似文献   

16.
随着待识别人数的增加,文本无关的说话人识别准确率下降明显. 针对这一问题提出了一种高准确率大规模说话人识别方法,该方法采用多个连续音频帧的声学帧特征构成声学特征图,进而获得高维度的2D-Haar声学特征,为训练出性能更优的分类器提供可能;再利用AdaBoost.MH算法筛选出具有较好区分度的2D-Haar声学特征组合进行分类器训练. 实验结果表明,600人规模下的正确识别率为89.5%,100~600人规模下的平均准确率为91.3%. 该方法适用于大规模说话人的识别,引入的2D-Haar声学特征有效,识别准确率高. 此外,该方法还具有较低的算法复杂度和较高的时间效率.   相似文献   

17.
主要探讨先验概率未知情况下的分类器设计问题。为了解决传统的最小最大分类器性能有限的不足,提出了基于分段线性化的分类器设计方法。方法不仅是最小最大准则的改进,而且也是最优贝叶斯分类器的更好近似。通过说话人识别的应用,验证了所提出算法的有效性。  相似文献   

18.
把二维DCT变换引入传统的LS信道估计算法,提出了一种基于DCT2/IDCT2的OFDM系统信道估计方法.通过对具有瑞利衰落信道的典型OFDM系统仿真,该算法性能比传统的LS算法有明显提高,尤其在低信噪比时该方法对系统性能提升更为突出,并研究了该算法性能受插值方法和多普勒频移的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号