期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周静芳陈一宁刘加刘润生《清华大学学报(自然科学版)》2004,44(7):942-945

在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。相似文献

2.

采用UBM更新量作为支持向量机特征的说话人确认

郭武戴礼荣王仁华《清华大学学报(自然科学版)》2008,48(Z1):704-707

在采用支持向量机的文本无关的说话人确认中,针对传统的均值超向量特征区分性不够明显的情况,该文提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优于均值超向量和传统的Gauss混合模型一通用背景模型(GMM-UBM)的方法.在2006年美国国家标准与技术研究所说话者识别(NIST SRE)lconv4w-lconv4w数据库上,该方法相对于基线的GMM-UBM系统等错误率降低了22％.实验结果表明:权重参数在支持向量机中具有重要的作用,在不考虑与UBM的耦合性的情况下超向量能够取得更强的分类能力. 相似文献

3.

电话信道下应用DMFCC进行说话人识别 总被引：2，自引：0，他引：2

王刚郑方《清华大学学报(自然科学版)》2009,(10)

鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。相似文献

4.

一种新的说话人识别序列特征提取方法

邢玉娟谭萍李明《兰州理工大学学报》2009,35(4)

针对支持向量机不能直接处理动态时间序列的语音数据问题,提出一种基于PCS-PCA分类器和AOI-Fisher分值(add original information fisher score)法的序列特征提取方法.首先利用PCA对每位注册说话人的特征向量进行维数约简,由转换矩阵得到每位说话人的主成分空间(principal component space,PCS),在此空间上快速判断出可能的R个说话人;然后在R个可能说话人的约简向量集上建立高斯混合模型;最后利用AOI-Fisher分值法进行向量定长转换的同时,为每位说话人的特征向量添加一维原始分类信息log P(X|θ).仿真实验结果表明,将该序列特征提取方法应用于SVM说话人确认系统,在不影响系统识别速度的情况下,具有较高的识别性能. 相似文献

5.

基于支持向量机的说话人识别

朱大伟张跃《南京工程学院学报(自然科学版)》2013,(4):52-57

支持向量机的说话人识别采用对音子的置信度进行综合的原理来完成对说话人身份的确认.以音子的置信度矢量为基础,分别采用支持向量机方法和平均值方法对音子的置信度进行综合,通过等错误率方面的研究发现,采用支持向量机方法大大低于平均值方法所获得的等错误率,等错误率大致可以从28％降至23％,而系统的复杂度仅略微地提高. 相似文献

6.

改进i-向量说话人识别算法研究

邢玉娟潘颖曹晓丽《科学技术与工程》2014,14(34)

针对信道变化环境下说话人识别系统鲁棒性差及识别率低的问题,提出一种改进i-向量说话人确认算法。首先,利用系统注册说话人GMM-UBM提取话者i-向量;然后,采用加权线性判别分析对i-向量降维和信道补偿,提取更具判别性的特征向量;紧接着,结合类内协方差归一化技术和ZT-norm规整技术对余玄距离得分进行规整,进一步消除信道干扰;最后,构建高鲁棒性余玄距离分类器判定目标说话人。仿真实验结果表明该算法可以有效地提高系统性能。相似文献

7.

基于LabVIEW的说话人确认系统设计

崔艳秋张俊星李敏许爽《大连民族学院学报》2013,15(5):543-546

设计了一个基于LabVIEW的说话人确认系统。以计算机作为硬件平台,以LabVIEW作为软件平台,通过计算机上的声卡采集语音信号,借助LabVIEW和MATLAB的混合编程对语音信号进行处理,以实现对说话人身份的确认。该系统界面友好,维护费用低,为说话人识别和语音识别系统的构建提供了一个有效的框架。相似文献

8.

一种改进的新型说话人确认算法 总被引：1，自引：0，他引：1

文学刘加刘润生《清华大学学报(自然科学版)》2003,43(1):51-54

在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。相似文献

9.

基于支持说话人权重的快速说话人自适应算法

蔡铁朱杰《上海交通大学学报》2005,39(12):1997-2001

针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法．该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能．有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人（SI）系统下降了5．82％,明显优于其他快速自适应算法．相似文献

10.

说话人识别技术的研究进展

檀蕊莲刘建平《科技资讯》2007,(33):5-6

说话人识别技术作为一种身份识别的手段,具有独特的优势,是语音信号处理中的重要组成部分,近年来也逐渐成为国际上研究的热点.本文综述了说话人识别技术的发展及其相关技术,对现有的各种方法的优点和不足进行了分析,并对其中存在的问题和未来的研究方向进行了探讨. 相似文献

11.

基于失配信息子空间失配补偿的话者确认

刘青松戴蓓蒨许东星吴德辉《中国科学技术大学学报》2010,40(8)

对于电话手机语音的文本无关说话人确认,语音受到传输信道、话筒等的影响,失配问题尤为显著.为此提出一种GMM-UBM框架下基于失配信息子空间的说话人确认失配补偿方法,该方法利用失配信息子空间和基准信息模型获得训练和测试语音的相对失配信息,此失配信息是失配信息子空间中超矢量的一种线性组合,补偿更为准确,能够根据失配对不同语音类的不同影响,对不同的语音类进行相应的补偿.NIST06数据库上的实验表明,经过失配补偿的系统性能在EER和MinDCF有近50%的提高. 相似文献

12.

基于高维空间映射失配补偿方法的说话人确认

郭伟李辉许敏强刘青松《中国科学技术大学学报》2010,40(2)

针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高. 相似文献

13.

说话人确认技术中的一种分类器选择方法

侯韬刘加《清华大学学报(自然科学版)》2010,(4)

目前主流的说话人确认系统一般包括若干个分类器,或称子系统,通过对各分类器输出分数的融合得到最终的识别结果。该文针对说话人确认系统线性分数融合中的分类器筛选问题,提出了最小矢量角(VAM)筛选准则,将各分类器得到的分数拼接成矢量,在分数矢量空间中考察各矢量的几何学关系,然后选取一个最优的矢量子集,使得它们经过线性组合能够与实际情况对应的参考矢量夹角最小。为了控制搜索规模,在分类器选取方案的优化中,采用模拟退火算法得到近似最优解。实验结果表明,基于VAM的分类器选择可以在降低所需分类器数目的同时提高系统的性能。较之依据单分类器性能最优准则选择分类器,在选择分类器数量n=16的情况下,系统等错误率相对下降15%。相似文献

14.

一种简单有效的说话人身份认证方法

于哲舟周春光李佳慧杨佳东《吉林大学学报(信息科学版)》2003,(Z1)

采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。相似文献

15.

含语音增强模块的i-向量说话人识别性能分析

李昕李为游寒旭朱杰《上海师范大学学报(自然科学版)》2016,45(2):237-242

为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献

16.

音源特征用于提高话者确认系统的鲁棒性

吴礼福姚志强戴蓓缮李辉《中国科学技术大学学报》2006,36(5):476-480

给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数：短时（单帧）特征参数和较长时（多帧）特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST＇03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 相似文献

17.

基于WCCN和余弦评分的话者确认研究

丁聪敏唐建郭立《中国科学技术大学学报》2012,42(10):813-819

本征音话者识别方法能够在一定程度上补偿因文本无关造成的语音类失配,但它并没有涉及另一个重要的失配因素——信道失配.本文提出了一种在本征音方法基础上补偿信道失配的方案.首先用本征音方法进行语音类失配补偿,然后采用WCCN(类内方差规整)进行信道失配补偿,从而得到经过语音类失配补偿和信道失配补偿的话者因子并将其作为话者模型,最后采用余弦评分方法进行性能评测.实验表明,本文方法在等误识率和最小检测代价函数上具有较好表现,同时本文方法对话者建模所需要空间较小. 相似文献

18.

用于SVM说话者确认系统的序列核

龙艳花郭武戴礼荣《清华大学学报(自然科学版)》2008,48(Z1):688-692

为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混合模型之间的Kullback-Leibler距离度量构造的SVM序列核函数对超向量进行训练和判决.在美国国家标准与技术研究所(NIST)2004和2006年说话人识别数据库上的实验证明了该核函数能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性.结果表明,本文提出的应用于说话者确认系统中的核函数不仅具有明确的物理意义,而且改善了识别系统的性能. 相似文献

19.

基于话者聚类的多系统输出评分融合话者确认

上官葳戴蓓蒨《兰州大学学报(自然科学版)》2008,44(3)

针对短电话语音条件下文本无关说话人确认问题中语音数据不充分和电话信道失配问题,利用说话人特征参数之间的互补性,提出了一种对多子系统输出评分采用多个网络的融合策略,提高了话者确认系统的整体性能.实验结果表明:与传统的所有话者共享一个输出评分融合网络相比,应用多个融合网络,在采用KLD和GLR模型相似性测度时,系统等误识率分别下降了12.7%和10.8%. 相似文献