首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.该文介绍了语音识别发展的过程,语音识别系统的结构和识别过程,模式识别理论和技术在语音识别研究中的应用以及语音识别中的关键技术和面临的问题.最后讨论了语音识别技术存在的优点和不足,并展望了其应用研究的前景.  相似文献   

2.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

3.
采用分层语法规则的加权概念转移网络,并将语法规则和类似于统计语言模型中的概率分布结合起来,通过引入平滑的概念,为一些超出词典的OOV词和超出语法规则的词分配一个较小的概率,使模型具有较强的稳健性.实验结果表明:这种分层语法表示灵活、概念清晰、实现简单,可以较大地降低语言模型的混乱度;模型在概念级的预测性能可达到99%的正确率.用该语言模型为语音识别提供预测单元,可以提高识别率.  相似文献   

4.
针对基于短时能量和过零率相结合的语音边界检测法在实际应用中的不足,提出了一种改进方法——基于短时相关性和极值点的语音边界检测法,并在MATLAB环境下进行实验测试,在语音客观评价及语音识别算法中取得了良好的效果.  相似文献   

5.
基于单片机的语音识别控制电压播报仪   总被引:1,自引:0,他引:1  
为实现利用人的语言和听觉来完成一系列双手工作的目的,我们借助于单片机对语音进行识别处理.语音识别控制电压播报仪是基于SPCE061A单片机开发出来的语音识别控制和播报系统.它的硬件部分主要由外部降压电路、MIC输入电路、SPCE061A单片机、音频放大设备等组成,软件部分则由语音识别训练模块、语音识别模块、模数转换模块、数据处理模块、语音播报模块组成,通过对系统的初始化和识别训练使之能够对所训练的语音进行识别,进而触发一系列过程:模数转换→数据处理→语音播报电压.实验结果表明,这个系统能够准确地识别语音命令,得到测量结果.  相似文献   

6.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

7.
Spark SDK是L&H公司推出的可进行二次开发的语音识别软件 ,它提供了一种快速简便的方法 ,使开发人员可以将语音部分识别功能添加到他们的应用程序中。在雷达情报口报录取器中 ,利用Spark SDK实现连接数字语音识别 ,并通过编写识别专业词汇的函数以及修改Spark SDK的语法规则等方法提高了语音识别软件的识别率。  相似文献   

8.
研究一种中文语音信息编码技术.通过采用语音小波分析识别处理和语音信息特征编码,包括中文语音小波包分解、语音音素和音节声调识别、口音特征参数提取、语音信息和特征参数组合编码,这种低比特率编码技术理论上可将传输效率提高1倍.  相似文献   

9.
本文阐述了语音识别技术的发展现状和趋势,简述了语音识别的基本原理,指出了语音识别技术的难点和对策,展望了语音识别的应用前景以及发展方向。  相似文献   

10.
本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍,然后提出了在孤立字词语音识别的一个新的算法,即新型的识别算法。通过此算法,系统可以在不降低系统识别精度的前提下,大大精简运算量,因此提高了识别系统整体的识别效率。实验证明,这种识别算法在基于模板的孤立字词语音识别中可以达到100%的识别精度,在基于非模板的孤立字词的语音识别中,其识别精度也可以达到90%以上,并且与传统的识别方法相比,缩短了训练时间,提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后,枸建一个使用方便的语音识别系统,将本算法应用到实践当中来解决人们现实生活中遇到的各种问题.  相似文献   

11.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

12.
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Corn-paq iPAQ上进行了测试,其计算代价不到整个系统代价的10%.  相似文献   

13.
基于词汇的蒙古语文语转换的实验   总被引:4,自引:0,他引:4  
蒙古语是一种很有影响的语言,较放西有许多独特的方面,本介绍了一个基于词汇的蒙古语语转换系统的设计与实现。  相似文献   

14.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

15.
探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务. 在Tellme Studio为开发平台下, 利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合, 实现Web天气信息实时语音交互查询, 提出了一种基于VoiceXML标准的天气信息语音发布模式.  相似文献   

16.
在语音识别系统中,易混淆语音是导致系统识别率下降的重要原因。汉语音节是由声母和韵母组成的,在易混淆语音中,其韵母部分的混淆度很大。针对易混淆语音的韵母部分,通过改进特征提取的方法来提高易混韵母之间的区分度,提出了一种基于小波分解和线性预测(WLPC)的特征提取方法,并用局部保持映射(Locality Preserving Projections)算法对提取的特征进行了特征变换。实验结果显示,与传统的MFCC特征相比,该特征能更好的区分不同的韵母。  相似文献   

17.
高第丕,美国南浸信传道会传教士。他与中国学者张儒珍合著的《文学书官话》刊定于1869年。《文学书官话》虽然影响巨大,但人们对它的认识不足。《文学书官话》用汉语官话口语写作,并把官话口语作为研究对象,"是一部正式的今话文文法书"(刘大白语)。它的特点是划分词类尽量立足于汉语实际;"名头"、"地步"、"位次"、"靠托言"等术语的提出,与后来的汉语研究有异曲同工之妙。  相似文献   

18.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

19.
从语言与思维的关系出发,论证语法的思维性,认为语法与思维是互为影响、互为映射的关系。语法不是一套简单规定语言是否正确的僵硬规则,它是动态的,与内容同是交际的一部分。篇章意义的表达与作者的语法选择是紧密联系在一起的。结合实例,说明要提高外语学习者的外语思维能力和写作能力,首先应该提高他们的语法知识,加强其语法技能,培养其用语法思维的能力。  相似文献   

20.
语言传输指数STI和语言可懂度指数SII为当前语言可懂度的两个主要客观评价体系.对STI和SII计算模型和测量结果的研究表明,二者并没有本质上的区别,测量结果的差别也主要是由采用的具体方法不同造成的;STI和SII的汉语语言可懂度主、客观评价关系曲线差别也不大,都可以用来对汉语的语言可懂度进行客观评价.但考虑到SII的测量过程更为复杂,在传统建筑声学等领域的应用也不具有优势,以及ANSI S3.5对测量条件限制的相对宽松可能会带来数据之间的可比性降低等因素,STI更适用于对汉语语言可懂度的客观评价.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号