共查询到20条相似文献,搜索用时 19 毫秒
1.
2.
主要讨论了对于小词汇量孤立词的汉语语音识别问题。文中采用欧洲通信标准委员会(ETSI)发布的GSMEFR声码器对输入语音信号进行特征提取。在识别模块采用基于动态规划原理的动态时转弯析(DTW)技术对提取的测试语音参数与训练模板的语音参数进行匹配,得到的误差最小值即为识别结果。实验结果表明,对于20条语音命令,识别准确率达到96%以上,识别时间小于1.5s。 相似文献
3.
4.
语音机器人由一块单片机和机器人机械框架组成(包括用于走路的电机、用于头部旋转的电机、用于加速和用于弹射的电机等),可以让机器人在语音指令控制下实现多项功能,而软件设计是基于单片机强大的语音控制功能完成机器人语音控制动作的,其中包括主程序、机器人动作控制子程序、语音播放子程序及语音识别程序。 相似文献
5.
基于嵌入式下的语音机器人的设计与实现 总被引:1,自引:0,他引:1
语音机器人由一块单片机和机器人机械框架组成(包括用于走路的电机、用于头部旋转的电机、用于加速和用于弹射的电机等),可以让机器人在语音指令控制下实现多项功能,而软件设计是基于单片机强大的语音控制功能完成机器人语音控制动作的,其中包括主程序、机器人动作控制子程序、语音播放子程序及语音识别程序。 相似文献
6.
高性能汉语数码语音识别算法 总被引:13,自引:0,他引:13
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% . 相似文献
7.
对168智能语音系统核心技术(语音合成技术,语音识别技术,VXML技术)进行了着重描述。 相似文献
8.
汪林林 《西南师范大学学报(自然科学版)》2005,30(2):235-239
语音语法是自动语音识别的重要参考依据.在基于Voice XML的语音增值业务中应用越来越广泛.介绍了VoiceXML与语法的关系.描述了语音识别原理.推导出了常用的Nuance语法形式逻辑表达式.在此基础上,构建了一个语音拨号系统,并着重阐述了其中语音语法的应用. 相似文献
9.
高性能汉语数码语音识别芯片系统 总被引:1,自引:0,他引:1
在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。 相似文献
10.
11.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献
12.
针对数字音乐语音情感识别问题,提出一种基于特征差异度和SVM投票机制进行识别的方法.该方法不仅降低了特征向量的维度,而且保留了足够的能够描述数字音乐语音不同情感之间差异的特征.同时,该方法利用多个二分SVM分类器进行投票,减少了每个分类器的权重,从而降低了误差.实验结果表明,该方法能够有效地提高识别准确率. 相似文献
13.
文章介绍了语音识别的技术、应用领域和藏语语音识别技术的现状,以及语音识别的基本原理及识别的过程分析,探讨了藏语语音识别技术中的难点问题,并展望藏文语音识别技术的发展方向和前景。 相似文献
14.
基于语音识别的说话人身份辨识系统 总被引:2,自引:0,他引:2
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间. 相似文献
15.
VoiceXML作为电话访问Internet网络的W3C标准,在介绍了其系统结构、解释程序、特点和语音识别及合成技术的基础上,设计和实现了完整的VoicexML语音浏览器,包括解析器、识别引擎、合成引擎和语音通道,实现了计算机网络与电话技术的完美结合。 相似文献
16.
李鑫 《新疆师范大学学报(自然科学版)》2007,26(3):126-128
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能. 相似文献
17.
以模糊集理论为基础,提出了一种汉语指令识别的模糊语音描述和模糊匹配算法,在语音信号的时间规整中,使用一种改进的非线性帧数规整算法,在40条指令的识别实验中,正确率达93%以上。 相似文献
18.
19.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
20.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率 相似文献