首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

2.
分析了潜语义分析语言模型在建模和解码过程中的主要问题, 实现了潜语义分析语言模型的建模, 并提出一种在连续语音识别系统一遍解码框架中融合的方法. 实验结果表明, 该方法可有效地提高大词汇汉语连续语音识别系统的性能.   相似文献   

3.
嵌入式语音识别Mahalanobis距离计算模块   总被引:1,自引:0,他引:1  
为了达到嵌入式语音识别系统低成本、低功耗的目标,提出一种算法硬件映射方法.将基于连续隐含Markov模型语音识别算法中占系统总运算量的50%以上的Mahalanobis距离计算,映射为硬件实现的模块.通过该方法,系统在较低时钟频率下即可完成嵌入式语音识别中实时处理的要求,从而大大降低系统功耗.实验结果表明,该模块在0.18 μm 和舰工艺库下实现,仅需1.2 mm2, 包含64 kb 静态随机存储器.应用该模块可以大大提高嵌入式语音识别系统的性能,达到降低成本,降低功耗的目标.  相似文献   

4.
在嵌入式系统的系统级建模和性能分析过程中,经常需要定量地分析和评估系统的平均延时、CPU占用率等性能指标.本文基于SystemC语言,针对嵌入式系统设计了一套性能分析评估的库函数,用于统计性能参数样本、计算期望值和置信区间,同时在性能指标满足要求的精度时终止仿真.并详细阐述了性能分析库函数的设计方法.以语音识别系统为例,设计了一个虚拟仿真平台,并使用该性能分析库函数进行性能分析,仿真结果表明,设计的库函数适用于嵌入式语音识别系统的性能分析,在一定程度上对SystemC的类库进行了扩展.  相似文献   

5.
汽车噪声中自动语音的识别技术   总被引:5,自引:0,他引:5  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

6.
语音识别系统的识别率十分依赖基于Hidden Markov Models(HMM)模型的训练技术.然而,经典的训练算法(Baum-Welch算法)有一个致命的缺陷,即所得最终解依赖于初始值的选取,只得局部最优解,这就影响了系统的最终识别率.针对传统语音识别系统识别率较低的现状,提出了一种改进的小波变换HMM语音识别算法.该算法首先通过小波变换对原始语音信号进行了降噪处理,然后使用语音样本对利用遗传算法改进后的HMM模型进行训练,并用于语音识别.实验结果表明:所提出的算法实用有效,识别率显著提高.  相似文献   

7.
基于SQLite技术的汉语语音识别数据库的建立   总被引:1,自引:1,他引:0  
建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明:一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。  相似文献   

8.
介绍一种嵌入式语音识别系统的设计与实现,整个系统以TI公司的双核(ARM DSP)处理器芯片OMAP5912为控制核心,采用SENSORY公司的RSC364语音芯片来实现语音的识别与合成,并进行语音信号的采集和播放,整个系统结构简单,集成度高.驾驶员利用该系统可通过语音命令控制车上设备及获得语音反馈信息,系统也可以作为一嵌入式语音设备使用,具有较大的市场应用前景.  相似文献   

9.
鲁棒语音识别技术综述   总被引:1,自引:0,他引:1  
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.  相似文献   

10.
防止假冒者闯入说话人识别系统   总被引:3,自引:0,他引:3  
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右.  相似文献   

11.
语音识别系统在现代社会的应用越来越广泛,本文通过对语音识别系统中的关键技术的论述,对语音识别系统的应用市场进行简单分析。  相似文献   

12.
基于SPCE061A单片机的语音识别系统开发   总被引:5,自引:1,他引:5  
文章给出了基于16位单片机SPCE061A的语音识别系统的软件和硬件设计。该系统实现了语音的采集、回放、特征提取、单词识别等功能。利用SPCE061A的语音处理优势构成的各种嵌入式系统具有广阔的应用前景。  相似文献   

13.
基于传统的语音识别系统的缺点,提出了一套基于虚拟仪器和 BP 神经网络的语音识别系统设计方案。利用LABVIEW 软件和 PC 机声卡硬件相结合采集和提取语音数据特征,并把数据分成测试集和训练集,再调用 MATLAB Script 节点利用 BP 神经网络对测试集进行学习并对训练集进行识别。经过测试,该系统识别准确率高、成本低,具有一定的适用性。  相似文献   

14.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元.基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行.  相似文献   

15.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

16.
在嵌入式系统的系统级建模和性能分析过程中,经常需要定量地分析和评估系统的平均延时、CPU占用率等性能指标。本文基于SystemC语言,针对嵌入式系统设计了一套性能分析评估的库函数,用于统计性能参数样本、计算期望值和置信区间,同时在性能指标满足要求的精度时终止仿真。并详细阐述了性能分析库函数的设计方法。以语音识别系统为例,设计了一个虚拟仿真平台,并使用该性能分析库函数进行性能分析,仿真结果表明,设计的库函数适用于嵌入式语音识别系统的性能分析,在一定程度上对SystemC的类库进行了扩展。  相似文献   

17.
提出了一种利用动态数量高斯分量拟合不同音素,利用拟合的音素组合作为补白参与语音关键词识别系统二次判决的方法.首先分析了为音素分配动态的高斯分量数量来训练音素模型的可行性;进而寻找能够准确描述音素且保证描述在不同音素之间有足够区分度的高斯分量个数;利用得到的音素与高斯分量数量的关系训练动态高斯添加的音素隐马尔科夫模型,利用模型的排列组合作为补白为语音关键词识别系统添加第二次判决来减小系统错误识别率.实验表明,利用这种方法进行语音关键词系统二次判断,能将原系统错误率降低至14.79%.  相似文献   

18.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

19.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。  相似文献   

20.
设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统.本语音识别系统的语音库包括8 400个电视机转台控制命令的语音数据.在无噪环境下对特定语音命令的识别率可达93.2%,正常电视背景环境下的识别率降至49.0%,对电视背景下通过分离后的语音命令识别率可达85.8%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号