期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王璐潘文林《云南民族大学学报(自然科学版)》2019,(5):510-516

目前,高准确率的语音识别需要在大规模语料库上进行学习才能获得,然而大规模语料库的构建成本较高,某些语言很难采集到充足的语料,因此,基于小规模语料库的语音识别已成为目前挑战性的研究问题.元学习是模仿人类利用已有经验快速学习新知识的机器学习方法,在机器视觉单样本学习任务中表现出明显的优势,已成为新的机器学习研究热点.将元学习应用于单样本语音识别是解决基于小规模语料库语音识别这一挑战性问题的有效途径,在TIMIT和佤语数据库上,开展了基于Reptile元学习算法的单样本孤立词语音识别研究.实验结果表明,该算法能有效地提升模型收敛速度与泛化精度,从而提升了模型的学习能力,说明元学习方法有助于解决小规模语料语音识别这一挑战性问题. 相似文献

2.

一种基于GRU神经网络的语音增强方法

彭月蒙祖强杨丽娜《广西大学学报(自然科学版)》2021,46(6):1533-1548

对语音增强的方法研究开始于20世纪70年代,目前形成了4大类传统的语音增强方法,包括谐波增强法、谱减法、基于语音生成模型的算法和基于短时谱估计的算法.但语音信号本身为非平稳信号,无论时域分析或者频域分析,其本身的信号特征均不明显,同时噪声信号常常多个叠加,特征复杂、频带宽,现有语音增强效果并不理想,甚至容易引入音乐噪声.语音交流是人类的基本沟通交流方式,用途广泛,但是在语音通讯的过程中不可避免的会受到来自环境噪声、电气噪声、传输介质等干扰,干扰后将影响人的收听辨识效果或者影响其他语音信号的处理(如语音识别).因此,有必要在音频数字化后实行适当的增强措施来提高辨识度.基于此,提出一种综合了多种方法的新语音增强处理结构.该结构结合短时傅里叶变换、谱减法、噪声谱估计和机器学习技术等,实现更强的语音增强效果.通过与前馈BP网络及LSTM网络对比,实验证明了该方法的有效性.并验证使用GPU计算技术加速的可行性. 相似文献

3.

融合语音增强与后续补偿的抗噪声语音识别方法 总被引：2，自引：1，他引：2

丁沛曹志刚《清华大学学报(自然科学版)》2003,43(7):919-922

为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%. 相似文献

4.

一种基于自适应模糊滤波的语音增强方法 总被引：1，自引：0，他引：1

下载免费PDF全文

王金明张雄伟《解放军理工大学学报(自然科学版)》2003,4(1):17-20

在语音识别和语者识别中，通常需要先将输入的语音信号进行去噪处理，这样可使识别的正确率大大提高，通常采用基于LMS算法和RLS算法的自适应线性滤波器来进行去噪。提出了一种基于自适应模糊滤波器的语音增强方法，该模糊滤波器是一种非线性滤波器，它在语音信号的特征域空间采用参数映射的方式来滤除噪声，并能够进行自适应结构调整和参数更新。实验结果表明，采用自适应模糊滤波器来滤除噪声比线性滤波器具有更好的效果。相似文献

5.

基于维特比算法的深度神经网络语音端点检测

李文洁张晴晴张鹏远颜永红摆亮《重庆邮电大学学报(自然科学版)》2018,30(2):210-215

语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。相似文献

6.

一种新型语音识别算法的应用

肖媛媛《中国新技术新产品精选》2009,(7):1-2

本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍，然后提出了在孤立字词语音识别的一个新的算法，即新型的识别算法。通过此算法，系统可以在不降低系统识别精度的前提下，大大精简运算量，因此提高了识别系统整体的识别效率。实验证明，这种识别算法在基于模板的孤立字词语音识别中可以达到100％的识别精度，在基于非模板的孤立字词的语音识别中，其识别精度也可以达到90％以上，并且与传统的识别方法相比，缩短了训练时间，提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后，枸建一个使用方便的语音识别系统，将本算法应用到实践当中来解决人们现实生活中遇到的各种问题. 相似文献

7.

汽车噪声中自动语音的识别技术 总被引：6，自引：0，他引：6

韦晓东胡光锐《上海交通大学学报》1998,32(10):10-13

汽车中的话音拨号系统是自动语音识别技术的应用热点．自动语音识别系统是一个基于训练的系统．在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用．为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法．提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法．对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性．相似文献

8.

一种改进的DTW语音识别系统 总被引：1，自引：0，他引：1

苏昊王民李宝《中国西部科技》2011,10(1):38-39,94

动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。相似文献

9.

语音增强用于抗噪声语音识别 总被引：12，自引：1，他引：11

徐义芳张金杰姚开盛曹志刚王勇前《清华大学学报(自然科学版)》2001,41(1):41-44

语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能相似文献

10.

鲁棒语音识别技术综述 总被引：1，自引：0，他引：1

吕钊吴小培张超《安徽大学学报(自然科学版)》2013,(5):17-24

鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用. 相似文献