共查询到19条相似文献,搜索用时 93 毫秒
1.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法. 相似文献
2.
陶安 《上海大学学报(自然科学版)》1998,4(2):227-231
将声道模型视为全极点模型,采用具有定点运算性质的Schur算法求得部分相关系数,利用LPC对数倒谱分析求得语音识别系统中采用的待识特征量——倒谱.本系统以倒谱作为特征参数,采用加权倒谱距离求得待识量与以K-均值聚类所得的参数库之间的特征距离,利用最小距离原则进行识别.经验证,本文所采用的方法取得了较好的实验结果 相似文献
3.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 相似文献
4.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果. 相似文献
5.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 相似文献
6.
应用倒谱特征的带噪语音端点检测方法 总被引:7,自引:0,他引:7
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适 相似文献
7.
语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征参数能够有效识别语音情感. 相似文献
8.
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。 相似文献
9.
采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率. 相似文献
10.
11.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。 相似文献
12.
说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向. 相似文献
13.
14.
15.
研究的说话人识别系统,采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时对特征参数各维分量的识别能力进行定量分析,采用一种新的加权方法进行矢量量化,在此方法下系统取得识别率很高的效果,而且计算量和存储量都比较低. 相似文献
16.
针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。 相似文献
17.
连接数字语音识别系统的DSP实时实现 总被引:2,自引:0,他引:2
:针对各种数字信息,实现了一种基于TMS320C5x 评价模块(EVM)的与特定人无关的连接数字语音识别系统.在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum -Welch 重估算法,有效地提高了系统的识别率.给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响.在具体实现中,着重处理了抗噪及实时实现问题.实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到92% ,为其实用化提供了较为重要的技术途径. 相似文献
18.
在说话人识别系统中,提出反映说话人个性的语音特征参量是系统的关键问题之一.在研究小波包变换的基础上,借鉴MFCC参数和其一阶差分参数的提取方法,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC.实验证明:这种方法具有较高的识别率. 相似文献
19.
实现了一个基于双分界面的支持向量机的文本无关说话人识别系统,该系统在建立模型的过程中使用高斯混合模型进行特征提取,有效地减少了数据集的规模。与传统的支持向量机方法相比,该方法不仅达到了更高的识别率,对环境具有良好的鲁棒性,并且降低了算法的时间复杂度。由于该方法对大规模数据集的处理能力,使其比传统的方法更适合应用于实际。在相关实验中,也证实了该方法的有效性。 相似文献