首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

2.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

3.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

4.
提出了一种基于SDCN算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化(SDCN)算法直接在倒谱域根据输入语音帧的信噪比(SNR)来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。  相似文献   

5.
声码器半解码参数用于说话人身份确认   总被引:2,自引:0,他引:2  
面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码—特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(ANN-WB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMM-UBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性.  相似文献   

6.
基于G.729编码参数的语音特征及其应用   总被引:1,自引:1,他引:1  
目的从低比特率语音编码参数中直接提取语音特征。方法针对G.729编码技术提出了一种从编码参数直接计算倒谱系数和基音/能量轨迹特征的方法。结果该方法通过对残差信号进行线性预测分析,提高了谱包络的精确程度,并从码本增益和延时参数中得到了基音/能量轨迹特征。结论说话人识别的实验结果显示,新方案能够使得基于G.729编码参数的说话人识别效果得到较明显的提高,达到了用解码语音进行识别的水平。  相似文献   

7.
距离加权矢量量化文本无关的说话人识别   总被引:10,自引:0,他引:10  
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。  相似文献   

8.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高.  相似文献   

9.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

10.
基于神经网络的语音识别研究   总被引:3,自引:0,他引:3  
由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具.为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较.介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构.其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别.实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%.  相似文献   

11.
说话人识别中语音特征参数研究   总被引:1,自引:0,他引:1  
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。  相似文献   

12.
以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(uni-versal background,UB)数...  相似文献   

13.
随着待识别人数的增加,文本无关的说话人识别准确率下降明显. 针对这一问题提出了一种高准确率大规模说话人识别方法,该方法采用多个连续音频帧的声学帧特征构成声学特征图,进而获得高维度的2D-Haar声学特征,为训练出性能更优的分类器提供可能;再利用AdaBoost.MH算法筛选出具有较好区分度的2D-Haar声学特征组合进行分类器训练. 实验结果表明,600人规模下的正确识别率为89.5%,100~600人规模下的平均准确率为91.3%. 该方法适用于大规模说话人的识别,引入的2D-Haar声学特征有效,识别准确率高. 此外,该方法还具有较低的算法复杂度和较高的时间效率.   相似文献   

14.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

15.
实现了一个基于双分界面的支持向量机的文本无关说话人识别系统,该系统在建立模型的过程中使用高斯混合模型进行特征提取,有效地减少了数据集的规模。与传统的支持向量机方法相比,该方法不仅达到了更高的识别率,对环境具有良好的鲁棒性,并且降低了算法的时间复杂度。由于该方法对大规模数据集的处理能力,使其比传统的方法更适合应用于实际。在相关实验中,也证实了该方法的有效性。  相似文献   

16.
基于调制域谱减法的鲁棒性说话人识别   总被引:1,自引:1,他引:0  
针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。  相似文献   

17.
在说话人识别系统中,提高反映说话人个性的语音信号特征参数的有效性和实时性是问题之一.本文在使用线性预测系数倒谱(LPCC)和美尔倒谱系数(MFCC)计算特征参数的基础上利用Fisher准则,构造了一种新的混合特征参数.这种新的参数在不增加系统计算量的同时,结合了LPCC和MFCC各自的优点,具有更好地表征说话人特征的能力,并在一定程度上消除特征的信息冗余,有利于信息的实时处理.  相似文献   

18.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识剐系统的识别性能.  相似文献   

19.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号