期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王金明张雄伟《解放军理工大学学报(自然科学版)》2006,7(3):214-219

为了研究模糊聚类算法在高斯混合模型（GMM）参数获取方面的应用,采用模糊C均值算法（FCM）进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率. 相似文献

2.

基于FVQMM的说话人识别

成新民张迎蒋云良《辽宁工程技术大学学报(自然科学版)》2007,26(5):719-722

为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。相似文献

3.

基于GMM统计参数和SVM的说话人辨认研究

贺志阳张玲华《南京邮电大学学报(自然科学版)》2006,26(3):78-82

支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。相似文献

4.

一种新的高斯混合模型参数估计算法 总被引：3，自引：0，他引：3

王超侯丽敏《上海大学学报(自然科学版)》2005,11(5):475-480

该文提出了一种高斯混合模型（GMM）参数估计的改进算法．原始的特征向量先经Schmidt正交化消除各维间的相关性,再用数学形态学方法估计出各维概率分布中混合分量的真实个数,最后按真实的混合分量个数用EM算法对各维分别作标量GMM参数估计．该方法能缓解GMM传统参数估计算法引起的“不易扩展”的不便．实验结果表明,将其应用于说话人辨认,能在较大幅度提高训练速度的基础上相对传统GMM参数估计方法获得更高的识别率．相似文献

5.

噪声补偿应用于与文本无关的说话人辨认研究

邱洪吴淑珍《北京大学学报(自然科学版)》2005,41(1):115-121

通过对VQ码本在线性频谱域进行噪声补偿,使得补偿后的VQ码本逼近测试环境下训练出的码本,从而提高说话人辨认系统的性能。实验中,在不同的信噪比条件下测试辨认率,并将补偿和没有补偿时的辨认率进行比较,结果显示,该算法能够有效地提高说话人辨认系统的性能。相似文献

6.

说话人辨认中基于进化策略的最大互信息训练方法

茅晓泉胡光锐唐斌《上海交通大学学报》2003,37(3):335-337

针对最大似然训练分辨能力的不足，把最大互信息训练方法引入到高斯混合模型（GMM）的训练中，并直接采用进化策略实现模型参数的全局训练，以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强，而且摆脱了局部搜索的缺陷。实验结果表明，这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法（EM）生成的系统。相似文献

7.

一种简单有效的说话人身份认证方法

于哲舟周春光李佳慧杨佳东《吉林大学学报(信息科学版)》2003,(Z1)

采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。相似文献

8.

说话人自动识别技术研究

曹敏王浩川《中州大学学报》2007,24(2):122-124

主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。相似文献

9.

基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引：1，自引：0，他引：1

曾毓敏吴镇扬《东南大学学报(自然科学版)》2008,38(6)

提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献

10.

应用于说话人识别的AdaBoost GMM算法

胡海清张歆奕《五邑大学学报(自然科学版)》2006,20(3):36-40

与文本无关的话者识别一般采用高斯混合模型(GMM),而AdaBoost算法是用于提高各种现有学习算法精度的一种通用的优化算法.论文中讨论如何应用AdaBoostGMM算法进行说话人识别. 相似文献

11.

一种量子神经网络说话人识别方法 总被引：1，自引：1，他引：1

下载免费PDF全文

王金明王耿郑国宏孙健《解放军理工大学学报(自然科学版)》2012,(3):242-246

针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。相似文献

12.

基于高斯混合密度函数估计的语音分离 总被引：3，自引：0，他引：3

虞晓胡光锐《上海交通大学学报》2000,34(2):177-180

基于最大熵法（ＭａｘｉｍｕｍＥｎｔｒｏｐｙ,ＭＥ）、最小互信息量法（ＭｉｎｉｍｕｍＭｕｔｕａｌＩｎｆｏｒｍａｔｉｏｎ,ＭＭＩ）和最大似然法（ＭａｘｉｍｕｍＬＩｋｅｌｉｈｏｏｄ,ＭＬ）最解决盲信号分离问题的常用算法,分析了ＭＥ、ＭＭＩ以及ＭＬ算法之间关系。基于高斯混合模式（ＧａｕｓｓｉａｎＭｉｘｔｕｒｅＭｏｄｅｌ,ＧＭＭ）概率密度函数估计,提出了一种采用反馈结构的扩展最大熵语音分离算法,与相似文献

13.

基于AdaBoost的汉语方言辨识

顾明亮夏玉果张长水杨亦鸣《东南大学学报(自然科学版)》2008,38(4)

为了在训练样本受限的情况下,提高汉语方言辨识的效果,提出了一种基于AdaBoost的汉语方言辨识新方法.该方法将GMM与语言模型组成的辨识系统看成一组弱分类器,然后对这组弱分类器所得的分类结果进行加权投票,最终决定汉语方言测试语音的所属类别.实验结果表明:增加GMM或弱分类器的个数,可以有效提高系统的辨识效果;测试语音越长,系统辨识效果越好;当训练样本有限的情况下,采用AdBoost方法比采用ANN方法具有更高的辨识率. 相似文献

14.

基于VQ-HMM的无教师说话人自适应方法

赵力刘怡龙邹采荣高西奇吴镇扬《东南大学学报(自然科学版)》2001,31(2):23-26

提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ－HMM,同时采用无教师自适应矢量量化算法,来改变VQ－HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码（孤立和连续数码）识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。相似文献

15.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

16.

一种新型汉语单音节识别方法 总被引：1，自引：0，他引：1

曹洪《清华大学学报(自然科学版)》1990,(4)

介绍了一种新型字基ＶＱ／ＨＭＭ语音识别方法：ＶＱ与ＨＭＭ分级识别算法。使得ＶＱ部分可用作语音识别的第一级处理，ＨＭＭ部分作第二级识别。在第一级识别中可引进汉语的音素知识，使ＶＱ／ＨＭＭ性能进一步提高，并可用于大字汇表的实时语音识别，存贮量、计算量均大大减少。用此方法把汉语四声作一个ＨＭＭ模型，使汉语４００个基本音节的识别率达９６％以上．若加上精确四声识别则可识别汉语的１２００种声音。相似文献