期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭武戴礼荣王仁华《清华大学学报(自然科学版)》2008,48(Z1):704-707

在采用支持向量机的文本无关的说话人确认中,针对传统的均值超向量特征区分性不够明显的情况,该文提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优于均值超向量和传统的Gauss混合模型一通用背景模型(GMM-UBM)的方法.在2006年美国国家标准与技术研究所说话者识别(NIST SRE)lconv4w-lconv4w数据库上,该方法相对于基线的GMM-UBM系统等错误率降低了22％.实验结果表明:权重参数在支持向量机中具有重要的作用,在不考虑与UBM的耦合性的情况下超向量能够取得更强的分类能力. 相似文献

2.

防止假冒者闯入说话人识别系统 总被引：3，自引：0，他引：3

张利鹏曹犟徐明星郑方《清华大学学报(自然科学版)》2008,48(Z1):699-703

如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40％左右. 相似文献

3.

基于参考说话人模型和双层结构的说话人辨认

王刚邬晓钧郑方王琳琳张陈昊《清华大学学报(自然科学版)》2011,(9):1261-1266

为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。相似文献

4.

用于SVM说话者确认系统的序列核

龙艳花郭武戴礼荣《清华大学学报(自然科学版)》2008,48(Z1):688-692

为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混合模型之间的Kullback-Leibler距离度量构造的SVM序列核函数对超向量进行训练和判决.在美国国家标准与技术研究所(NIST)2004和2006年说话人识别数据库上的实验证明了该核函数能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性.结果表明,本文提出的应用于说话者确认系统中的核函数不仅具有明确的物理意义,而且改善了识别系统的性能. 相似文献

5.

一种基于小波神经网络混合模型的说话人识别方法

李战明陈迪《兰州理工大学学报》2007,33(2):77-80

提出一种混合模型,即将隐马尔可夫模型(HMM)和小波神经网络(WNN)相结合应用于说话人识别的模型.该方法利用HMM的时序建模能力以及小波神经网络较强的模式分类能力,进行与文本无关的说话人的识别.实验表明,采用这种混合模型可以提高系统的识别率,特别在噪声环境中具有一定的噪声鲁棒性,提高了识别性能. 相似文献

6.

基于多音素类模型的文本无关短语音说话人识别

张陈昊郑方王琳琳《清华大学学报(自然科学版)》2013,(6):813-817

对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。相似文献

7.

基于i-vector全局参数联合的说话人识别

下载免费PDF全文

杨明亮龙华邵玉斌杜庆治《重庆邮电大学学报(自然科学版)》2021,33(1):144-151

以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(uni-versal background,UB)数据与训练数据耦合性的问题导致模型性能不佳.提出了基于i-vector全局参数联合(global parameter joint of identify vector,GPJ-Ⅳ)的说话人识别方法.该方法利用背景说话人特征训练得到说话人通用背景模型(universal background model,UBM),构建基于全局联合差异空间和联合信道补偿的GPJ-Ⅳ模型.通过实验测试并与传统方法进行对比,实验结果显示,所提出的GPJ-Ⅳ模型相比i-vector模型,等错误率(equal error rate,EER)和最小检测代价函数(minimum detection cost function,MinDCF)性能分别提升了58.99％和15.9％. 相似文献

8.

基于GMM托肯配比相似度校正得分的说话人识别

《清华大学学报(自然科学版)》2017,(1)

该文提出一种基于Gauss混合模型(GMM)托肯配比相似度校正得分(GMM token ratio similarity based score regulation,GTRSR)的说话人识别方法。基于GMM-UBM(通用背景模型)识别框架,在自适应训练和测试阶段计算并保存自适应训练语句和测试语句在UBM上使特征帧得分最高的Gauss分量编号(GMM token)出现的比例(配比),然后在测试阶段计算测试语句和自适应训练语句的GMM托肯分布的配比的相似度GTRS,当GTRS小于某阈值时对测试得分乘以一个惩罚因子,将结果作为测试语句的最终得分。在MASC数据库上进行的实验表明,该方法能够使系统识别性能有一定的提升。相似文献

9.

改进i-向量说话人识别算法研究

邢玉娟潘颖曹晓丽《科学技术与工程》2014,14(34)

针对信道变化环境下说话人识别系统鲁棒性差及识别率低的问题,提出一种改进i-向量说话人确认算法。首先,利用系统注册说话人GMM-UBM提取话者i-向量;然后,采用加权线性判别分析对i-向量降维和信道补偿,提取更具判别性的特征向量;紧接着,结合类内协方差归一化技术和ZT-norm规整技术对余玄距离得分进行规整,进一步消除信道干扰;最后,构建高鲁棒性余玄距离分类器判定目标说话人。仿真实验结果表明该算法可以有效地提高系统性能。相似文献

10.

说话人识别中简化的信道因子估计 总被引：1，自引：0，他引：1

郭武戴礼荣王仁华《清华大学学报(自然科学版)》2008,48(Z1):664-667

在与文本无关的说话人识别研究中,因子分析是减少信道影响的有效的方法之一,但是因子分析在估计信道空间时需要大量的数据以及复杂的EM(expectation maximization)运算,在测试的时候对数似然度函数的计算量非常大.该文采用主成分分析的方法来简化信道因子的估计过程,首先采用混合Gauss模型的均值超矢量估计出信道因子所在的空间,然后通过特征映射的方法在特征参数域中减去信道因子的影响.在美国国家标准与技术研究所(NIST)2006年lconv4w-lconv4w数据库上,采用该文方法的系统等错误率相对基线系统降低24％.采用本文中的信道因子估计和特征映射的方法,能够在保持高识别性能的前提下,大大简化运算的过程,对系统的实时实现有重要的意义. 相似文献