首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

2.
研究了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE—LSA)估计的语音增强算法,给出了其算法分析的基本流程图。由于语音是时变的,因此,假设语音频谱分布为高斯分布,在此基础上讨论了MMSE—LSA算法的先验信噪比ξh的2种估计方法——最大似然估计方法和直接判决估计方法。试验证明此方法的语音增强效果较好,尤其在较低信噪比时效果更明显。  相似文献   

3.
研究了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE-LSA)估计的语音增强算法,给出了其算法分析的基本流程图.由于语音是时变的,因此,假设语音频谱分布为高斯分布,在此基础上讨论了MMSE-LSA算法的先验信噪比ξk的2种估计方法--最大似然估计方法和直接判决估计方法.试验证明此方法的语音增强效果较好,尤其在较低信噪比时效果更明显.  相似文献   

4.
为了提高基于短时(1 s)心电信号进行身份识别的准确率,本文提出了一种残差块的一维卷积神经网络(one-dimensional convolutional neural network,1D-CNN)的短时心电信号身份识别方法。该方法采用快捷连接设计以解决深层卷积网络随着卷积层数增加而性能退化的问题,并通过增加卷积层数和卷积核数量来保证网络能够更充分地提取特征,进而提升网络的分类性能。本文方法在两个公开数据库心电数据库(electrocardiogram identification database,ECG-ID)和德国联邦物理技术研究院心电图诊断数据库(physikalish-technische bundesanstalt diagnostic ECG database,PTB)进行了实验,当采用一个心动周期(大约1 s)信号进行身份识别时,准确率分别达到了97.963%和99.359%。实验结果表明本文方法可以有效地提高短时心电信号的身份识别的准确率。  相似文献   

5.
语音识别的神经网络方法研究   总被引:1,自引:0,他引:1  
用前馈多层神经网络方法研究了计算机对于不同语音输入者的识别能力。输入层为语音的平均频率、均方频率、频率宽度、平均振幅、均方振幅、振幅宽度;输出层为识别输入者;隐含层的节点数为8,最后预测结果成功率为82.5%.这为研究人与机器的语音识别提供一种方法。  相似文献   

6.
基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。  相似文献   

7.
提出一种新的基于瞬时无功功率理论和小波-神经网络技术对电能质量进行辨识的方法。首先对各种电能质量信号进行时域和幅值分析,将在幅值上有显著特征的短期电能质量扰动信号识别出来;再对其余的信号进行小波变换,提取与信号频域相关的特征量来表征不同电能质量信号。将这些特征量作为神经网络(ANN)的输入可以实现电能质量的辨识。计算结果表明了该方法的有效性和准确性。  相似文献   

8.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

9.
基于神经网络的语音识别研究   总被引:3,自引:0,他引:3  
由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具.为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较.介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构.其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别.实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%.  相似文献   

10.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

11.
本文从最大后验概率估值的角度讨论了语音信号识别中的时间规整问题,讨论了由此导出的方法与常用的动态时间规整方法之间的关系,并对这一方法的普遍意义及其在语音识别中的应用提出了看法。  相似文献   

12.
语音识别技术综述   总被引:6,自引:0,他引:6  
语音识别技术作为信息社会朝着智能化和自动化方向发展的关键技术之一,具有重要的研究意义和实用价值。经过近五十年的艰苦探索和研究,语音识别技术研究获得了极大的发展,其中有些比较成熟的技术已经逐步应用于日常生活中。但总体来说,语音识别在研究和实用化方面的难度还比较大。本文概括介绍了语音识别技术的全貌,包括其发展历史、所采用的关键技术、具体应用以及当前所面临的困难与研究趋势。  相似文献   

13.
针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。  相似文献   

14.
基于语音识别的说话人身份辨识系统   总被引:2,自引:0,他引:2  
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间.  相似文献   

15.
孙峰 《科学技术与工程》2011,11(9):2021-2024,2033
输入语音信号中声音的特征提取和分类识别可以通过多层前馈神经网络大量学习实现,但基于误差反向传播的前馈神经网络(BP神经网络)标准算法收敛速度慢,在训练中效率不高。采用一种快速稳定的Levenberg-Marquardt算法进行语音识别,通过对语音信号的预处理、特征提取和网络结果优化,建立了网络训练样本集,用MATLAB进行了仿真,仿真结果表明,该算法优于传统的BP算法,具有更好的收敛性。  相似文献   

16.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。  相似文献   

17.
基于离散隐马尔科夫模型的语音识别技术   总被引:1,自引:0,他引:1  
概述语音识别技术的基本原理,对当前三种主要识别技术--动态时间规整技术、隐含马尔科夫模型技术及人工神经网络技术进行比较,重点介绍基于离散隐马尔科夫模型(DHMM)的语音识别系统的实现.  相似文献   

18.
研究了噪声对语音信号的干扰规律,利用语音信号的准周期性,较好的提取了含噪语音信号的频谱包络。通过一些改进算法,对包络峰值特征提取方法进行优化,并使用工程数学软件Matlab对此方法进行了模拟计算。结果表明:该方法可以较好的重建被噪声污染的语音谱包络,从而较好的提取到频谱的包络峰值特征。  相似文献   

19.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

20.
提出了一种基于双权值神经网络的非特定人连续语音识别的新算法.这种算法可以不经过端点检测和分割,构建连续语音中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号