首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统.实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率.同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中.语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展.  相似文献   

2.
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检...  相似文献   

3.
语音信号的主分量特征   总被引:7,自引:0,他引:7  
利用曲线拟合与主分量神经网络相结合的方法,提出了一种既反映声道变化符合人耳听觉特点和语音识别新特征。与其他神经网络识别特相比,新特征不仅可以提高语音识别准确率,而且具有算法简单,存储容量小,便于实时实现的特点。  相似文献   

4.
摘要: Alpha稳定分布噪声导致二阶循环谱相干系数失效,使相应的通信信号调制识别算法退化. 针对这个问题,提出了基于分数低阶循环谱相干系数的识别算法. 文中给出了分数低阶循环谱相干系数的相关理论,分析了通信信号的分数低阶循环谱相干系数,在此基础上提取谱相干系数循环频率域特征作为识别特征参数. 用BP神经网络为分类器,实现了通信信号调制方法识别. 仿真结果表明,在Alpha稳定分布噪声下,该识别算法性能优于基于二阶循环谱相干系数的方法. 在高斯噪声条件下,两种识别算法性能相当.  相似文献   

5.
识别LSB和USB的门限自适应算法   总被引:1,自引:0,他引:1  
基于语音谱的统计特性提出了一种从模拟话音SSB信号中自动识别出LSB或USB调制方式的算法.该算法简单,计算量小,非常适合用DSP来实时实现;门限自适应处理使得该算法鲁棒性较好.仿真结果表明该算法在低信噪比时仍有令人满意的识别效果.  相似文献   

6.
语音识别技术应用的进展   总被引:3,自引:0,他引:3  
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率。同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中。语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展。一、语音识别技术的第一次发展语音技术的发展始于20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语…  相似文献   

7.
提出了一种基于蚁群聚类神经网络的汉语耳语音声调识别方法.根据耳语音发音特点,以听神经平均发放率、幅值包络、共振峰、声道长度等构成的多维矢量描述声调特征,采用蚁群聚类算法将多维特征矢量聚类后,送入局部有监督特征映射神经网络进行声调识别.这一方法通过对特征参数的聚类压缩了神经网络的输入神经元数目,因而可以有效避免在大数据条件下神经网络不易收敛及速度慢的问题.对多人耳语音声调的识别实验显示,采用蚁群聚类神经网络的耳语音声调识别方法与传统方法相比,性能明显提高,平均正识率达到87.5%.  相似文献   

8.
基于人耳听觉模型和汉语语音的短时平稳特性,提出一种鲁棒性的汉语普通话声调提取方法.采用基于人耳听觉模型的相关图来提取语音信号的基频,运用无监督的侧抑制神经网络来模拟人耳侧抑制属性进行基频检测,为了克服在低信噪比情况下侧抑制神经网络的误判问题,引入了相邻语音帧的语音基频的帧间约束.试验表明,该方法在信噪比很低的条件下,仍能较准确地识别出目标语音声调,并能在双话者同时发音的情况下实现各自的声调分离.  相似文献   

9.
普通话水平客观测试中的韵母测试研究   总被引:1,自引:1,他引:0  
在分析比较语音共振峰、LPCC、MFCC与Bark谱等语音特征参数的基础上,选择了Bark谱作为普通话水平客观测试中的韵母评测参数,实验结果表明其语音区分能力优于其他特征.根据音征互载的特点,提出了声韵结合的韵母评测建模方法.针对鼻韵母评测精度低的问题,提出了对鼻韵尾段单独建模的二次评价策略.通过对在普通话水平测评现场录制的语音数据进行的评测实验,证明所提出方法能有效提高评测精度,其韵母总体评测精度达到95.80%.  相似文献   

10.
针对现有计算机语音识别的缺陷,提出一种模仿人耳听觉特性的Mel频率倒频谱特征,对它与现有的线性预测倒频谱特征进行实验对比研究,表明将人耳听觉特性应用于计算机语音识别,能产生更高的识别精度。  相似文献   

11.
自组织特征映射神经网络用于语音识别的研究   总被引:4,自引:0,他引:4  
该文提出了一种优化的自组织学习算法。基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法,组成了一种新的语音识别系统,该系统采用SOM网络作为矢量量化器。SOM网络经过优化的自组织学习算法训练后,再用K均值聚类算法对其进行调整。实验结果表明,该文提出的语音识别方法确实能提高系统的识别率。  相似文献   

12.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法.  相似文献   

13.
在语占识别系统中,都是通过提取特征向量来计算待识语音与模型之间的概率或距离,然后根据最大概率或最小距离判断待识语爵的类别.对大量实验数据的观察发现:特征向量的各维对语音的表达能力是不一样的,同时特征向星在语音的时间轴上表达能力也不一样。根据这种特性,提出了三种训练算法:在训练中计算出加权矩阵,以此来加强易混淆数字间的本质区分特征,减弱随机特征,在汉语数字串识别实验中,得到了比较理想的实验结果,错误下降40.8%,系统识别率上升到94.08%。  相似文献   

14.
MHMM和ANN法结合的语音识别方法   总被引:1,自引:1,他引:1  
提出了一种改进的隐马尔柯夫模型(MHMM)方法,并在MHMM方法中结合进人工神经网络(ANN)方法,以这种方法为基础建立了语音识别系统。实验结果表明,与隐马尔柯夫模型方法比较,新系统的识别率有所提高,从而,充分地显示了人工神经网络在语音识别中的可行性和有效性。  相似文献   

15.
提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测. 在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音的语音信号活动检测(speech activity detection, SAD)性能与盒维相似,明显好于谱熵算法. 多种噪声环境下的SAD检测结果显示,所提算法的误检率远低于谱熵算法,在除白噪声以外各种条件下的误检率均低于盒维算法,且计算量约为盒维算法的5%. 实验表明,该算法在SAD检测和效率两方面具有良好的综合性能.  相似文献   

16.
提出了一种基于MAP算法的连续语音识别无教师讲者自适应方法,给出了简单有效的渐进自适应公式.通过识别实验结果表明,提出的方法能利用少量的自适应数据达到满意的学习效果,是一种实用和有效的讲者自适应方法.  相似文献   

17.
阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性.  相似文献   

18.
针对易混淆词特征差异小,分类决策困难的特点,提出了一种新的语音识别特征。该特征可以根据待识单词的发音特点,通过选用合适的基函数及加权处理,突出混淆词特征之间的差异性;  相似文献   

19.
讨论了一种新型的模糊MLP神经网络及其在清浊音判决中的应用,该网络实现了多参量的综合评判,而且有效地处理了语音信号的模糊性,从而获得了较高的判决准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号