共查询到20条相似文献,搜索用时 62 毫秒
1.
《上海师范大学学报(自然科学版)》2016,(2)
提出了一种用于文本相关说说话人确认技术的i-向量提取方法和L-向量表示.一段用于注册或识别的语音可以用i-向量和L-向量联合表示.同时提出了一种改进的用于支持向量机(SVM)后端分类的核函数,改进的核函数可以同时区分说话人身份的差异和文本内容的差异.在RSR 2015语料集合1和集合2上验证系统的性能,实验结果显示改进的算法相对于传统的i-向量系统的基线能提高至多30%的识别率. 相似文献
2.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献
3.
一种改进的新型说话人确认算法 总被引:1,自引:0,他引:1
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。 相似文献
4.
鉴于应用支持向量机进行说话人识别过度依赖于选择核函数的问题,提出一种基于组合核函数支持向量机(SVM)的说话人识别方法.对多项式核函数、径向基核函数进行线性加权,构建既具有全局核函数优点又具有局部核函数优点的组合核函数,并通过多重网格搜索调节权重系数使组合核函数适用于当前数据分布,确定组合核函数SVM 的最优参数,实现对说话人的有效识别.对TIMIT 数据集和含噪声数据集的仿真实验显示,基于组合核函数SVM 的说话人识别性能明显优于单一的多项式核函数、径向基核函数和线性核函数. 相似文献
5.
距离加权矢量量化文本无关的说话人识别 总被引:10,自引:0,他引:10
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。 相似文献
6.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献
7.
8.
9.
支持向量机的说话人识别采用对音子的置信度进行综合的原理来完成对说话人身份的确认.以音子的置信度矢量为基础,分别采用支持向量机方法和平均值方法对音子的置信度进行综合,通过等错误率方面的研究发现,采用支持向量机方法大大低于平均值方法所获得的等错误率,等错误率大致可以从28%降至23%,而系统的复杂度仅略微地提高. 相似文献
10.
说话人识别中SVM核函数参数优化研究 总被引:1,自引:0,他引:1
在基于SVM的说话人识别系统研究中,如何获得理想的识别率是亟待解决的问题。SVM核函数是众多影响识别率因素中最明显的。该系统提高识别率的技术关键是SVM核函数的选取及其参数优化。为此,在对三种常用核函数的特点进行研究的基础上,利用网格搜索法来分别进行参数优选,通过实际语音的训练和识别验证识别效果。目前优选参数可以实现识别率≥99.9%且识别时间<0.1 s。 相似文献
11.
基于鉴别性i-vector局部距离保持映射的说话人识别 总被引:1,自引:0,他引:1
为了进一步提高i-vector说话人识别系统的性能,该文提出了一种鉴别性i-vector局部距离保持映射(discriminant i-vector local distance preserving projection,DIVLDPP)的流形学习算法。该算法以i-vector间的Euclid距离作为度量准则,并以最小化同类点间距离同时最大化异类近邻点间距离的鉴别性准则作为优化目标函数,利用求解广义特征值的方法,得到最终的投影映射矩阵。在美国国家标准技术局2008年说话人识别核心数据集上的实验结果表明:该算法可以明显提高目前i-vector说话人识别系统的性能。 相似文献
12.
设计了一个基于LabVIEW的说话人确认系统。以计算机作为硬件平台,以LabVIEW作为软件平台,通过计算机上的声卡采集语音信号,借助LabVIEW和MATLAB的混合编程对语音信号进行处理,以实现对说话人身份的确认。该系统界面友好,维护费用低,为说话人识别和语音识别系统的构建提供了一个有效的框架。 相似文献
13.
本文介绍了一个实时、有效的话者自动验证系统,重点对话者验证的机理进行了分析,并对与验证系统有关的几个主要问题作了简要的说明。该系统的主要特点是:选择了最能反映话者特征的基音和第二、三共振峰频率及其时变特性作为特征参数,有效地保证了系统验证的正确率;硬件上采用了以高速处理芯片C25作成的语音处理板,保证了话者验证中大量的计算工作的实时性;结构上将语音处理板作成PC机的插板形式,用户能通过PC机的友好人机接口对其实施各种有效的管理。目前该系统已在PC机上试制成功,初步测试表明达到了研制要求。 相似文献
14.
For text-independent speaker verification, the Gaussian mixture model (GMM) using a universal background model strategy and the GMM using support vector machines are the two most commonly used methodologies. Recently, a new SVM-based speaker verification method using GMM super vectors has been proposed. This paper describes the construction of a new speaker verification system and investigates the use of nuisance attribute projection and test normalization to further enhance performance. Experiments were conducted on the core test of the 2006 NIST speaker recognition evaluation corpus. The experimental results indicate that an SVM-based speaker verification system using GMM super vectors can achieve appealing performance. With the use of nuisance attribute projection and test normalization, the system performance can be significantly improved, with improvements in the equal error rate from 7.78% to 4.92% and detection cost function from 0.0376 to 0.0251. 相似文献
15.
为有效找出会议语音中的说话人角色个数及各角色的说话人语音,提出了一种多说话人角色聚类方法.首先定义说话人角色聚类的特征,然后采用测地距离度量特征的相似度,进而提出了一种利用类内距离来控制类间合并的多说话人角色聚类方法,最后采用4种不同类型的会议语音对该方法进行测试.结果表明:对手工分割和自动分割后的会议语音进行说话人角色聚类时,如果采用相同的聚类方法,则使用测地距离的性能优于使用传统距离的性能;如果采用相同的距离度量方法,则文中方法的性能优于传统层次聚类方法. 相似文献
16.
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。 相似文献
17.
为了建立一个数字串说话人身份确认系统 ,采用了基于数字HMM的与文本有关的身份确认方式 ;使用限定在数字范围内的任意数字串为语音文本 ,并内嵌能较好反映说话人特征的关键数字来提高确认性能 ;最终对多个关键数字的确认子系统进行综合判决 ,以提高HMM识别性能鲁棒性 .文中重点研究了基于关键数字HMM的身份确认 ,提出了以模型间的距离测度为准则来选择说话人的关键数字 ,并通过对比实验表明了用计算KLD上限的方法进行模型间距离测度的有效性 . 相似文献
18.
基于傅立叶核与径向基核的支持向量机性能之比较 总被引:2,自引:0,他引:2
支持向量机(SVMs)是由Vapnik提出的一种建立在统计学习理论上的新方法。这种方法被深入地研究并广泛应用在诸如分类和回归问题上。由于其基于结构风险最小化的机理,因此相对于其他的经典方法有着更好的泛化特性,其中核函数的选择对支持向量机的性能有着很大的影响。深入地研究了基于傅立叶核函数的支持向量机的特性,得出在某些特殊的情况下,基于傅立叶核函数的支持向量机的性能要好于基于RBF核的支持向量机。最后的仿真对其进行了比较验证。
相似文献
19.
基于傅立叶核与径向基核的支持向量机性能之比较 总被引:5,自引:0,他引:5
支持向量机(SVMs)是由Vapnik提出的一种建立在统计学习理论上的新方法:这种方法被深入地研究并广泛应用在诸如分类和回归问题上。由于其基于结构风险最小化的机理,因此相对于其他的经典方法有着更好的泛化特性,其中核函数的选择对支持向量机的性能有着很大的影响。深入地研究了基于傅立叶核函数的支持向量机的特性,得出在某些特殊的情况下,基于傅立叶核函数的支持向量机的性能要好于基于RBF核的支持向量机。最后的仿真对其进行了比较验证。 相似文献
20.
针对正弦余弦算法(SCA,sine cosine algorithm)局部搜索能力差的缺陷,提出自学习策略和Lévy飞行的正弦余弦优化算法(SCASL,sine cosine optimization algorithm with self-learning strategy and Lévy flight)。首先,提出正弦余弦算法自学习策略和非线性权重因子,使搜索个体记忆自身历史最优位置,在寻优过程中指导搜索个体更新位置,提高SCA的局部搜索能力;算法寻优后期,当搜索陷入局部最优时,采用基于Lévy飞行的停滞扰动策略使算法跳出局部最优,提高SCA的局部最优规避能力。基于13个经典基准测试函数对算法性能进行测试的实验结果表明,SCASL相比标准SCA和较新的优化算法SSA,VCS,WOA,GSA,具有更高的计算效率,收敛精度以及更强的局部最优规避能力。求解无人作战飞机航迹规划的仿真结果表明,在有6个敌方威胁源的战场环境中,相比SCA,SCASL求解得到的飞行航迹具有更小的航迹代价。综上,所提出的SCASL具有较强的寻优能力。 相似文献