期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

程小伟王健曾庆宁谢先明龙超《科学技术与工程》2017,17(3)

针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。相似文献

2.

基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引：1，自引：0，他引：1

曾毓敏吴镇扬《东南大学学报(自然科学版)》2008,38(6)

提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献

3.

含语音增强模块的i-向量说话人识别性能分析

李昕李为游寒旭朱杰《上海师范大学学报(自然科学版)》2016,45(2):237-242

为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献

4.

基于支持向量机和小波分析的说话人识别研究

张振领贾仰理《聊城大学学报(自然科学版)》2007,20(4):84-87

说话人识别技术目前已经成为身份认证及人工智能领域研究的一个热点，解决噪声环境下的说话人识别问题具有重要的理论价值和深远的实用意义．针对这一问题，提出了一种基于支持向量机和小波分析的识别方法及其框架模型，并且设计与实现了一个识别系统，即利用小波阈值去噪法将语音信号和噪声分离，实现语音增强，最终采用SVM分类器基于样本进行训练和测试，实现说话人的分类识别．相似文献

5.

基于稀疏谱的鲁棒说话人识别

《河南大学学报(自然科学版)》2016,(5)

环境失配问题严重影响着说话人识别的性能,这一问题在非平稳噪音条件下表现得更为显著.为了增强说话人识别在环境失配条件下的鲁棒性,基于稀疏表示提出了一种高维鲁棒语音特征的生成方法,并针对上述高维语音特征的稀疏特性提出了一个说话人模型.在该说话人识别方法中,首先以优化的联合基作为稀疏表示的基,在此基础上对信号进行分解,用于从带噪语音中剥离噪音成分,并从中提取语音信号的内蕴时频结构;之后在此基础上提出了一种鲁棒的稀疏谱语音特征,并根据该特征的高维稀疏特性给出了基于混合k-means的说话人模型.实验结果显示,与基于梅尔倒谱系统特征的基线系统相比,提出的说话人识别方法在NIST SRE-2003语料库条件下的等错误率下降了28.16%,在Chinese-863语料库和不同信噪比(5dB和0dB)的非平稳汽车噪音环境下的等错误率分别下降了9.84%和14.21%.上述结果表明,在环境失配情况下,提出的说话人识别方法的性能明显优于基于梅尔倒谱系数特征的基线系统. 相似文献

6.

听觉掩蔽门限在说话者识别中的应用 总被引：2，自引：0，他引：2

韦晓东胡光锐任晓林《上海交通大学学报》1999,33(12):1521-1524

语音信息在人的听觉系统中的表示具有一定的冗余性．利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进．听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”．经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高．通过对宽带噪声－白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法．相似文献

7.

汽车噪声中自动语音的识别技术 总被引：5，自引：0，他引：5

韦晓东胡光锐《上海交通大学学报》1998,32(10):10-13

汽车中的话音拨号系统是自动语音识别技术的应用热点．自动语音识别系统是一个基于训练的系统．在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用．为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法．提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法．对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性．相似文献

8.

基于PCANN/PDP混合结构的噪声环境下说话人识别方法的研究

夏菽兰《盐城工学院学报(自然科学版)》2008,21(2):35-38,43

提出了一种基于PCANN／PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络（PCANN）。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。相似文献

9.

基于维特比算法的深度神经网络语音端点检测

李文洁张晴晴张鹏远颜永红摆亮《重庆邮电大学学报(自然科学版)》2018,30(2):210-215

语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。相似文献

10.

基于目标声源方位已知的双麦克风噪声抑制 总被引：1，自引：0，他引：1

张健付中华谢磊赵亚丽《清华大学学报(自然科学版)》2011,(9):1215-1219,1225

复杂噪声抑制是语音技术实用化的基础。很多应用中,目标说话人的方位相对固定,而噪声的类型、个数、位置均是未知的,且可能随时间变化。针对这类应用,该文提出一种基于语音信号时频分布稀疏性的半盲双麦克风噪声抑制方法。首先假定说话人方位已知且固定,并根据方位关系建立其空间方位模型,实际噪声的空间方位模型根据观测数据在目标说话人空间方位模型上自适应得到;然后对每个时频点进行分类,并建立二元掩膜;最后利用二元掩膜重构目标语音。实验结果显示:该方法在复杂噪声环境下仍具有显著的降噪效果,且语音失真度较低,其降噪性能接近于噪声源方位已知下的非盲降噪方法。相似文献

11.

基于航迹特征的飞行程序噪声预测研究

张召悦《科学技术与工程》2013,13(30)

针对目前飞行程序减噪设计的需要,研究了民机的航迹特征,选取了声暴露级（SEL）作为单个事件的飞机噪声评价指标,并在研究飞行程序特点的基础上,结合飞机噪声性能（ANP）数据库和NPD噪声计算方法,建立了一套基于航迹特征的离场飞行程序噪声预测方法。以某民用机场的离场程序为例,绘制出噪声等值线图,验证了方法的可行性。实例证明,该方法可以量化预测飞行程序的噪声影响,规范了飞行程序噪声预测的方法,可以为减噪飞行程序设计提供参考。相似文献

12.

管道噪声有源控制系统的次级声源和误差传感器位置优化

刘会灯邱阿瑞《清华大学学报(自然科学版)》2011,(3):382-389

基于直流电机运行噪声的特点,对于管道有源噪声控制系统的次级声源和误差传感器位置选择,提出了两种优化策略并给出了物理系统的优化设计结果,通过实验验证了两种优化策略的可行性。在优化后的管道实验平台中使用不同有源噪声控制算法进行管道噪声控制实验,噪声源分别为160~550 Hz的单频率正弦周期信号和基波100 Hz,1—5次谐波的多频率正弦周期信号时,两种优化策略最大的降噪量分别达36.2 dB和26.4 dB,降噪效果显著,表明有源控制系统可以有效降低电机运行噪声。相似文献

13.

基于关键数字和HMM的数字串说话人身份确认系统

陈雁翔戴蓓蒨周曦李辉《中国科学技术大学学报》2004,34(1):70-75

为了建立一个数字串说话人身份确认系统 ,采用了基于数字HMM的与文本有关的身份确认方式 ;使用限定在数字范围内的任意数字串为语音文本 ,并内嵌能较好反映说话人特征的关键数字来提高确认性能 ;最终对多个关键数字的确认子系统进行综合判决 ,以提高HMM识别性能鲁棒性 .文中重点研究了基于关键数字HMM的身份确认 ,提出了以模型间的距离测度为准则来选择说话人的关键数字 ,并通过对比实验表明了用计算KLD上限的方法进行模型间距离测度的有效性 . 相似文献

14.

基于改进的小波阈值去噪和二级判断模型的说话人识别

李战明林娟陈若珠《兰州理工大学学报》2010,36(1)

针对目前说话人识别系统中噪声使得识别率严重下降的问题,在特征提取前用小波阈值去噪方法对带噪语音进行去噪处理.对于小波阈值函数以及阈值的选取进行研究,提出一种改进的阈值函数,小波阈值中的噪音方差估计采用基于实际噪音方差估计的谱熵法,将改进的小波阈值去噪结合一种二级判断模型提高噪声环境下的说话人识别率.在不同信噪比条件下进行试验,改进的小波阈值去噪法优于传统小波阈值去噪方法,改进后的阈值函数与二级判断模型相结合的识别率比原始语音DTW模型提高了7.9%,比原始语音GMM提高了4.6%,对于短时语音有较好的识别率. 相似文献

15.

基于CGRU多输入特征的地空通话自动切分

郭东岳林毅杨波《四川大学学报(自然科学版)》2020,57(5):887-893

自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98. 相似文献

16.

一种基于量子势阱组的说话人特征提取方法

王洋潘平田庚《科学技术与工程》2015,15(1)

说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向. 相似文献

17.

用于语音识别的减谱结合RASTA的抗噪声方法 总被引：1，自引：0，他引：1

黄石磊武剑虹匡镜明《北京理工大学学报》2003,23(5):621-624

主要论述加性和卷积性噪声条件下语音识别的抗噪方法．在特征提取阶段，用功率谱短时均值相减的谱减方法补偿加性噪声的影响，用在Mel频标倒谱域RASTA(relative specllral)滤波补偿卷积性噪声对语音识别系统的影响．在汉语非特定人孤立数字识别实验中，使用该方法的误识率比未使用该方法要低，并且需要很小的噪声先验知识和假设，运算简单．实验证明，提出的减谱结合RASTA的方法是一种比较有效地削减噪声的方法。相似文献