首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

2.
采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。  相似文献   

3.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

4.
基于GA/VQ的说话人辨认的研究与实现   总被引:3,自引:0,他引:3  
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。  相似文献   

5.
说话人识别技术是根据待识别人的语音与预先提取的说话人语音特征是否相匹配来鉴别说话人身份的一种生物认证技术,具有广泛的应用前景。采用矢量量化(VQ)方法,可以在信息量损失较小的情况下更好地压缩数据量,从而增高说话人识别系统的识别率。本文研究了说话人识别的相关技术,提出并设计了一个基于VQ的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

6.
大学生闽南语说话人识别语音库的设计   总被引:1,自引:0,他引:1  
设计了一个包含120名在校大学生的闽南语说话人识别语音库.该语音库可以根据闽南语口音、说话人性别等条件来进行语音语料的查询.针对不同口音的说话人进行了一系列的GMM(Gaussian Mixture Speaker Model)说话识别实验,验证了特定口音模型比非特定口音模型的识别率一般要高10%左右.  相似文献   

7.
提出一种新的可用于说话人识别的径向基函数网络(RBFN)阵列.RBFN网设计思想是在确定网络中心点之后采用最小线性方差作为目标函数解得最优权重,该方法并不能得到最优分类效果.使用Fisher目标函数,替代RBF中的误差目标函数来求取最优权重,用与文本无关的闭集说话人识别系统对该算法进行了验证,实验结果表明,该方法提高了RBF分类能力,比传统的RBF、算法以及ROLS算法具有更高的识别率,并在识别效果接近GMM方法的情况下计算量大幅度减少。  相似文献   

8.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

9.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

10.
基于矢量量化的组合参数法说话人识别   总被引:5,自引:0,他引:5  
 说话人识别的方法很多,提出的基于矢量量化(VQ)的算法,在语音特征表征上利用几种特征参数的组合使用来提高识别率,在VQ过程中,经典的K均值算法收敛速度快,但极易收敛于局部最佳点,为了使聚类算法收敛于全局最优点,同时提高识别率,采用模拟退火算法来改善聚类码本质量.讨论了具体的算法实现,并给出了一些实验数据,实验结果表明该处理方法是有效的.  相似文献   

11.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法.  相似文献   

12.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

13.
距离加权矢量量化文本无关的说话人识别   总被引:10,自引:0,他引:10  
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。  相似文献   

14.
刘祥楼 《科学技术与工程》2012,12(11):2590-2593
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。  相似文献   

15.
For text-independent speaker verification, the Gaussian mixture model (GMM) using a universal background model strategy and the GMM using support vector machines are the two most commonly used methodologies. Recently, a new SVM-based speaker verification method using GMM super vectors has been proposed. This paper describes the construction of a new speaker verification system and investigates the use of nuisance attribute projection and test normalization to further enhance performance. Experiments were conducted on the core test of the 2006 NIST speaker recognition evaluation corpus. The experimental results indicate that an SVM-based speaker verification system using GMM super vectors can achieve appealing performance. With the use of nuisance attribute projection and test normalization, the system performance can be significantly improved, with improvements in the equal error rate from 7.78% to 4.92% and detection cost function from 0.0376 to 0.0251.  相似文献   

16.
采用线性预测倒谱系数(linear prediction cepstrum coefficient, LPCC)作为语音的特征参数,矢量量化(vector quantity,VQ)方法进行模式匹配,探讨声纹识别以实现身份认证,并对此识别方法进行了相关的实验.通过验证,这种方法可以区分不同的说话人,并且在做说话人辨认实验时可达到较高的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号