首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
长时共振峰分布特征是近年来才开始使用的研究方法。目前尚未广泛的应用于声纹鉴定实务。本文将采用长时共振峰分布特征来探究声纹鉴定实务中经常遭遇的一种情形,即检材语音和样本语音音量不同的情况。实验用Lombard效应法增大语音,对30位发音人在正常和85分贝噪音两种不同的条件下进行录音。考察长时共振峰分布特征的变化,以期对声纹鉴定实务提供帮助。  相似文献   

2.
不同的录音环境会对人的发音造成一定的影响。通过听觉分析、视谱比较和声学参数测量等方法研究发音人在大学校园宿舍、教室、食堂、操场4种不同录音环境下语音特征的变化情况,总结归纳出不易受环境因素影响的语音特征、易受到影响而发生变化的语音特征,以期为声纹鉴定实践提供参考依据。  相似文献   

3.
声纹鉴定中常遇到伪装语音的检验,如采用捏鼻、假声、耳语、变更方言讲话等。伪装语音的出现,使声纹鉴定难上加难。本研究通过对男女各5人一组发音人的普通话部分短句为分析对象,探讨和分析捏鼻讲话时语音与正常语音样本的基音、振幅、宽带语图、共振峰等声学参数变化规律。结果表明,捏鼻讲话伪装方式虽然使语音特征发生改变,但是不同个体之间差异仍然大于自身差异,具备鉴定的条件和基础。  相似文献   

4.
文章采用基于Windows系统下的语音软件,采集了藏语语音声学数据参数和语音数据,建立了藏语语音数据库,并对录音数据进行了语音标注、统计和分析,最终描绘了现代藏语语音的声学实验特征。本语音软件可广泛应用于语音教学、语音分析、其他语言发音方式的研究以及法医声纹鉴定等工作。  相似文献   

5.
使用高质量声纹采集终端采集10名自然人的方言和普通话样本并存入声纹样本库,使用不同的录音方式录制多种方言的检材,在现有声纹库中对每个检材建立自动比对任务,考察声纹检材的目标召回率。通过实验总结出:一般案件中涉及到的手机录制的语音证据,可以使用声纹库综合应用平台服务于案件侦办工作或者作为串并案的依据;文本相同与否对比对结果有些微影响,相同文本的检材和样本之间相似度更大;同一人说的同一种语言能够准确召回。基于违法犯罪人员声纹库进行语音检材自动比对实验是对声纹库应用的积极探索,旨在总结一些应用技巧以服务于实战、并为声纹库的建设和应用提供有益的参考。  相似文献   

6.
在语音情感识别系统中,语音情感特征的提取尤为重要,本文在前期已有对EMD分解研究的基础上,将EMD分解与Teager能量算子相结合,用于语音情感识别。文中首先利用EMD分解得到一组IMF分量,再对各阶IMF分量提取Teager能量,然后通过对不同语种的不同情感语音的Teager能量在Mel频率的分析,提出了一种新的情感特征:基于EMD分解的Mel频率的Teager能量谱系数(ETMC),最后利用SVM分类方法对不同语种的不同情感进行识别,实验结果表明,该方法有很好的识别结果。  相似文献   

7.
现有的较多对运动性构音障碍病理语音的研究是以声学特征为条件来进行的,而对发音运动空间的研究较少,且数据库中普遍缺乏病患的发音及语音数据.本文基于多伦多大学开发的TORGO数据库,对比分析了构音障碍患者与正常人、不同病情程度的构音障碍患者之间在发音运动空间上的差异,提取发音空间特征,对构音障碍患者进行病情分级,为医学上诊...  相似文献   

8.
利用语音识别技术,依英语发音的特有性,搭建完整合理的计算机辅助英语发音评测系统。整个系统包括3个部分:语音段验证、语音信号切割和发音评测。其中语音段验证利用置信度评估的技术,并依据置信度阀值对评测语音内容是否需要评测做出判断;语音信号切割是以预先训练好的英语发音声学模型为切割依据,通过强制对位的方式切割出正确的发音区段;英语发音评测是系统的核心,使用的评测方式是比较评测语音和标准语音的相似度,采用4个评测特征:发音完整度、韵律性、语速和准确度进行发音相似度评测。针对不同的特征参数设计合理的评测机制,并对4个特征参数进行加权运算,以建立一个完整合理的英语发音评测系统。实验证明,系统能够给出比较客观的评分,达到预期设计目标。  相似文献   

9.
提出了一种基于PCANN/PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络(PCANN)。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。  相似文献   

10.
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,针对基于统计模型的似然比检验方法容易造成非语音信号误检的问题,提出了一种基于子带保留似然比的VAD算法.在似然比综合判决准则中引入保留因子,根据人耳对语音感知敏感度在频率上的差异,采用全局非均匀、局部均匀的方式划分子带,对似然比大于阈值的频率分量所对应的子带信号提取语音特征并根据特征强度设置保留因子,只使用保留的频分量似然比进行综合判决.实验结果表明:该算法在不同的低信噪比环境下检测性能均优于LRT(似然比检验)、MO-LRT(多观测似然比检验)等算法,其漏检率更低,同时有效减少了非语音信号似然比虚高而导致的误检,VAD判决准确率平均提高了2%~14%.  相似文献   

11.
单信道盲源分离是盲信号分离的重要研究方向.针对单信道线性混合语音信号一次分离后不能完全消除干扰语音的问题,提出了基于子频率分量高斯混合模型与贝叶斯理论的多次盲源分离方法.首先,对源语音的子频率分量分别进行训练,建立高斯混合模型;然后,应用贝叶斯理论从混合语音中首次分离源语音,并针对一次分离后目标语音中仍混有干扰语音的问题采取多次分离的方法,实现尽可能的彻底分离.实验结果表明,这种方法取得了良好的分离效果.  相似文献   

12.
该文提取了10位发音人30次正常发音情况下的语音,并从阴平、阳平、上声、去声四类声调入手,通过对各个发音人的声调格局、四种声调的基频值这两个语音参数进行提取分析,还对基频值的最大值、最小值、标准差、平均值用SPSS软件进行了统计分析。结果表明,第一,发音人自身的声调格局存在一定程度的变异,但是相对于不同发音人之间的声调格局差异来说是很小的,因此声调格局自身的稳定性还是比较显著的;第二,在不同发音人之间的声调格局差异比较大,因此声调格局在不同的发音人之间存在特异性。  相似文献   

13.
该文提出了一种适于说话人辨认的自适应频率尺度变换,基于说话人信息在不同频带中的非均匀分布性质,通过F比衡量不同频率子带对说话人信息的贡献大小,设计自适应频率滤波器,提高贡献大的频带的频率分辨率,降低贡献小的频带的频率分辨率,提取鉴别性特征DFCC。干净语音环境下,不同测试文件的实验表明,该文提出的DFCC特征的识别率比传统MFCC特征平均提高了1.45%,表明特征的稳定性好,对语音内容不存在依赖性;在不同信噪比的噪声环境下,识别率平均提高了6.37%,表明DFCC特征能够充分利用语音频带中包含的说话人信息,具有良好的抗噪性能。  相似文献   

14.
语音是语言的物质外壳和表达手段,在语音教学环境下,实时的发音纠正对语音教学过程的顺利实施非常重要.主要通过Sona-Match软件的工作模式和语音分析,来实时比较发音人在语音纠正前后的发音变化,为今后语音教学的改善和提升提供基础.  相似文献   

15.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

16.
重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,UBM)提取语音的语言学高层信息特征,并融合这些特征和Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征建立隐Markov模型(hidden Markov model,HMM)检测重叠语音,然后对处理后的语音进行说话人分割。实验结果表明:对于由TIMIT语音库生成的数据集,该方法对重叠语音检测的错误率比单一采用MFCC特征有显著降低,而且说话人分割性能有明显的提高。  相似文献   

17.
本文研究发音人识别特征参量的选择和提取,探讨参量选择的原则,提出一种混合特征矢量,并以时间域规正法规正语音长短。  相似文献   

18.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

19.
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。  相似文献   

20.
目的:为深入分析因数字录音笔自身的数字音频特性对部分声学参量的影响所产生的差异,对声纹鉴定实际工作提供帮助。方法:对两种录音笔及VS-99语音工作站录制的声样进行了声纹图谱及共振峰数据的检验。结果:发现差异主要表现在高频及低频信号处,而振幅曲线却表现出相对的稳定性。结论:在对录音笔录音检材的鉴定实践中,需要注意甄别高频信号的缺失及低频共振峰数据的差异,尽量使用与录制检材同一或同种的录音器材,同时可以将振幅曲线作为检验分析中一项重要参考参量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号