首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
用于语音识别的减谱结合RASTA的抗噪声方法   总被引:1,自引:0,他引:1  
主要论述加性和卷积性噪声条件下语音识别的抗噪方法.在特征提取阶段,用功率谱短时均值相减的谱减方法补偿加性噪声的影响,用在Mel频标倒谱域RASTA(relative specllral)滤波补偿卷积性噪声对语音识别系统的影响.在汉语非特定人孤立数字识别实验中,使用该方法的误识率比未使用该方法要低,并且需要很小的噪声先验知识和假设,运算简单.实验证明,提出的减谱结合RASTA的方法是一种比较有效地削减噪声的方法。  相似文献   

2.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

3.
通过分析汉语语音及非特定人语音特点,选择过零率、能量、基音周期和前两个共振峰作为语音特征,用音素分类的方法构造判决树,在此基础上,给出了一个非特定人普通话孤立数字音(0~9)识别系统,识别率大约为96.6%。  相似文献   

4.
介绍了一个在微机上实现的有限词,特定人语音识别系统,该系统采用连续,M元高斯混合密度的隐式马尔柯夫模型(CDHMM)为识别方法,以修改后的BaumWelch方法为训练重估算法,文中提出了对语音特征矢量非线性归一化预处理,和对训练数据不足的HMM模型特征空产是进行后处理修正的算法,还提出了一种基于语音知识的模型初始化的方法,经实验证明,系统的识别率可以达到90%以上。  相似文献   

5.
用 TMS320C31 实时实现电话语音识别系统   总被引:3,自引:0,他引:3  
描述了一个新型实时声控用户交换机语音接口的设计和实现。该系统使用数字信号处理器TMS320C31开发板在PC机WINDOW平台下实现了与人无关连续命令语音识别,完成拨号、进行电话交换。系统使用少量控制词加上连续数字串构成了电话用户交换系统的常用命令语句,并生成相应识别文法网络(语言模型)。识别采用改进的令牌传递式Viterbi算法。研究中还开发识别系统拒识算法,在无拒识情况下命令语句中数字识别率为98%以上,数字串(串长<4)识别率达到91%以上,通过加入拒识算法,字符串识别率可达95%以上。  相似文献   

6.
特定人孤立词语音识别系统的仿真与分析   总被引:2,自引:1,他引:2  
在MATLAB环境下利用语音工具箱Voice Box,设计并实现了基于DTW算法的特定人的孤立词语音识别系统.论述了高效DTW算法的基本原理及系统的实现过程.仿真结果表明,该系统对特定人的孤立词取得了良好的识别率.  相似文献   

7.
文章以整车非安全性车身电器为控制对象,给出了一种基于HMM算法的非特定人语音集成控制方案,详述了系统的硬件、软件设计方法,并实现了系统样机的研制。其中,系统语音识别单元是以Soc语音处理芯片SDA80D51为核心,并应用飞思卡尔高性能MCU——MC9S12XEP100作为执行单元主控芯片,实现了对非安全性车灯、自动空调、汽车雨刮、电动车窗和汽车音响的语音识别与集成控制。该系统在样机上进行了车载电器语音控制测试,测试结果表明系统在相对安静环境下的平均识别率可达94%。  相似文献   

8.
非特定人普通话孤立数字音识别系统   总被引:2,自引:0,他引:2  
通过分析汉语语音及非特定人语音特点,选择过零率、能量、基音周期和前两个共振峰作为语音特征,用音素分类的方法构造判决树。在此基础上,给出了一个非特定人普通话孤立数字音(0 ̄9)识别系统,识别率大约为96.6%。  相似文献   

9.
提出了一种可识别非特定人语音指令的电视机遥控器,旨在不对电视机做任何改动的情况下,通过遥控器红外学习,实现语音识别并对电视机实现控制。该设计采用了STC90LE52作为主控芯片,LD3320芯片作为语音识别芯片,STM32F103C8T6为红外发射部分主控芯片。最后通过实验证明该系统能在环境嘈杂的情况下正常识别用户的语音命令,具有一定的抗干扰性。该设计的成功实现为更多的智能语音控制为基础的智能家居设计积累了经验和奠定了基础。  相似文献   

10.
一种改进的混合型语音识别方法   总被引:2,自引:1,他引:1  
提出了一种改进的HMM语音识别方法,其主要特点是引入了加权函数算法,以减少系统的误识率,实验结果表明,这种识别方法不仅能提高系统的识别率,而且所需训练样本少。  相似文献   

11.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

12.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高.  相似文献   

13.
飞机驾驶员在飞行过程中有各种各样的说话方式,如带情感的对话、快速与慢速、大声与小声等.并且在飞行的状态下还需要承受物理与心理压力,对话语音还会产生变异,如果不做任何处理,直接用于传统的说话人识别系统以及语音识别系统来处理,性能会比较差.因此,本文对识别飞行员的说话方式(style)这一副语言信息进行了研究,以辅助后续的语音识别系统以及说话人识别系统.实验数据库包含了6 925个样本,实验中提取了384维声学特征,比较了支持向量机SVM不同核函数的分类能力.实验表明,采用高斯径向基函数的SVM具有最好的性能,平均准确率达到91.62%.   相似文献   

14.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:3,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

15.
当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

16.
采用STC11L08XE单片机作为主控制器,以LD3320芯片作为外扩语音控制器件,实现语音辨识功能和对空调运行状态的控制,如启动、停止、功能转换、温度调节、定时开关等.该语音控制系统由语音辨识模块、红外线传输模块、LED指示灯模块及按键触发模块组成.根据非特定人声语音辨识方案,设计相应的语音识别程序,并将语音控制系统模块集成到具有红外传输功能的空调遥控器电路中.实验结果表明,根据初始设定的语音命令可实现系统对空调的语音控制,该系统在一定距离范围内具有较高的识别率.  相似文献   

17.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

18.
This work demonstrates the use of the nonlinear time-frequency distribution (NL TFD) of a discrete time energy operator (DTEO) based on amplitude modulation-frequency modulation demodulation techniques as a feature in speech recognition. The duration distribution based hidden Markov module in a speaker independent large vocabulary mandarin speech recognition system was reconstructed from the feature vectors in the front-end detection stage. The goal was to improve the performance of the existing system by combining new features to the baseline feature vector. This paper also deals with errors associated with using a pre-emphasis filter in the front end processing of the present scheme, which causes an increase in the noise energy at high frequencies above 4 kHz and in some cases degrades the recognition accuracy. The experimental results show that eliminating the pre-emphasis filters from the pre-processlng stage and using NL TFD with compensated DTEO combined with Mel frequency cepstrum components give a 21.95% reduction in the relative error rate compared to the conventional technique with 25 candidates used in the test.  相似文献   

19.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

20.
王彪 《科学技术与工程》2012,12(10):2462-2464
为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号