首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。该文提出澄清式人机对话系统结构,用于实现语音识别错误恢复,实现了系统的4个组成部分:ASR错误检测、基于统计机器翻译(SMT)方法的澄清式疑问句生成模型、说话人响应分析、基于有限状态机(FSM)的对话管理模型。各模块均采用与特定任务无关的方法建立。实验结果表明:澄清式人机对话系统可以有效模拟口语中的澄清现象,在不同的错误环境中能够较好的实现ASR错误恢复任务。  相似文献   

2.
在分析语音识别原理的基础上,设计了一个基于ARM和DSP芯片的语音识别子系统,用于嵌入式系统中的语音识别,该语音识别子系统由ARM和DSP芯片为核心,配合其他功能电路,能够独立完成语音识别的工作,ARM芯片作为系统的控制芯片,DSP芯片负责对语音信号的隐马尔可夫模型建立,从而使得嵌入式系统的语音识别更为方便简捷,并且该子系统具有一定的通用性和可剪裁性.  相似文献   

3.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

4.
介绍了基于隐马尔可夫模型(HMM)技术的语音识别原理,以航行信号灯的控制为例,提出了孤立词语音识别技术应用于船舶智能控制的方法.采用C++编程和语音识别工具箱HTK相结合的方法进行软件设计,然后以数字信号处理(DSP)芯片TMS320C5409为主完成硬件设计,实验结果表明该控制方法的正确识别率达到98 %以上,具有一定的可行性.  相似文献   

5.
介绍一种嵌入式语音识别系统的设计与实现,整个系统以TI公司的双核(ARM DSP)处理器芯片OMAP5912为控制核心,采用SENSORY公司的RSC364语音芯片来实现语音的识别与合成,并进行语音信号的采集和播放,整个系统结构简单,集成度高.驾驶员利用该系统可通过语音命令控制车上设备及获得语音反馈信息,系统也可以作为一嵌入式语音设备使用,具有较大的市场应用前景.  相似文献   

6.
高性能汉语数码语音识别芯片系统   总被引:1,自引:0,他引:1  
在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。  相似文献   

7.
自动语音识别(ASR)技术目前已发展得较为成熟,通用ASR引擎已经广泛应用于交通、医疗、通信等行业。但是,由于行业专有词汇在大规模训练语料库中呈非独立同态分布,通用ASR引擎在各细分行业转写时存在对行业专有词汇识别准确率低的问题。相较于互联网环境的16 kHz音频采样率,电话呼叫中心语音为窄带低采样(采样率8 kHz),转写后精度下降尤为明显。为了提高行业词汇的语音转写准确率,文中提出一种基于行业词表的ASR转写后优化技术。首先,对语料库文本数据分别采用卷积神经网络模型和深度神经网络BERT模型进行预测分词,生成行业纠错词表。随后,在生产环境中,使用通用ASR引擎对电话呼叫语音数据进行初始转写。然后,对一次转写后的文本,通过Soft-Masked BERT模型结合纠错词表实现文本数据的纠错,从而提高语音识别准确率。使用广州12345热线客服通话语音数据进行训练和测试,结果表明,使用文中的转写后优化技术可以将通用ASR引擎的行业用词转写准确率提高约10个百分点,且纠错速度较快,具有良好的适用性。  相似文献   

8.
彩铃的语音搜索功能设计与实现   总被引:1,自引:0,他引:1  
随着彩铃业务的迅猛发展,彩铃平台中业务的人性化程度显得日趋重要.研究提出了一种在彩铃平台上实现语音搜索功能的方案.该方案结合ASR语音识别技术和搜索引擎索引技术,支持可配置的铃音排序策略,并可针对不同用户的喜好对搜索结果进行调整,是对彩铃业务的有力增强.  相似文献   

9.
基于模糊路面识别的4WID电动车驱动防滑控制   总被引:2,自引:0,他引:2  
针对四轮独立驱动(4WID)电动车的驱动防滑(ASR)问题,研究了基于模糊识别路面的控制方法.为了快速、准确识别低附着路面,提出了通过模糊规则将小滑转率、小附着区域的路面利用附着系数和滑转率估高的方法.利用4WID电动车四轮驱动力矩独立可控、转速和转矩易于获得的特点,实时估算路面利用附着系数和最优滑转率,控制各轮驱动力矩实现驱动防滑.仿真实验表明:基于模糊识别路面的4WID电动车ASR能够快速准确识别低附着路面,抑制驱动轮滑转,提高了车辆行驶稳定性和动力性.  相似文献   

10.
针对智能家居缺少语音控制的问题,使用HTK和Qt Creator联合设计了一款具有语音识别功能的图形控制界面.结合隐形马尔科夫模型语音识别工具HTK和Qt交叉编译,描述了嵌入式软硬件平台的搭建过程.着重介绍了多线程并行的语音控制流程和软件实现过程.实验结果表明,该界面可以稳定地运行在ARMLinux平台下,且功能实现完整.语音识别的加入使得设备操作更加人性化、简便化,具有很高的实用性.由于Qt的可移植性,该界面可在多种平台下编译运行,有较好的扩展性.  相似文献   

11.
基于嵌入式下的语音机器人的设计与实现   总被引:1,自引:0,他引:1  
语音机器人由一块单片机和机器人机械框架组成(包括用于走路的电机、用于头部旋转的电机、用于加速和用于弹射的电机等),可以让机器人在语音指令控制下实现多项功能,而软件设计是基于单片机强大的语音控制功能完成机器人语音控制动作的,其中包括主程序、机器人动作控制子程序、语音播放子程序及语音识别程序。  相似文献   

12.
文章介绍了一种基于DSP技术的电视机语音拨号遥控器.该设计采用了美国TI公司推出的语音识别芯片TMS320C5402,在不对电视机做任何改动的情况下,实现声控,介绍了该语音拨号器的性能与特点,以及基于定点DSP实现的语音训练和语音识别算法的流程图.  相似文献   

13.
基于语音识别的电子秘书手机   总被引:1,自引:0,他引:1  
将嵌入式系统和语音识别技术结合起来,设计并制作了一款基于语音识别的新型电子秘书手机.系统在硬件上以基于PXA270处理器的XScale平台为控制核心,经RS232串口外扩语音识别和GSM/GPRS模块.以Linux作为操作系统,通过对XScale平台和语音识别模块的编程,实现了录音、语音设定闹钟时间、自动播放以及自动群发短信等功能.测试结果说明:系统特有的图形化界面以及基于语音的人机交互方式可以方便地将重要信息准时通知给多人,实现了电子秘书的功能.  相似文献   

14.
介绍了语音识别技术ASR的发展历史、目前研究方法、技术手段及当前取得的成绩与不足,提出一种新的的研究理论——利用基因算法训练HMM方法.  相似文献   

15.
本设计完成一款基于32位单片机S1C33L05和zigbee技术,利用ICRoute公司的高性能芯片LD3320A实现非特定人语音识别,以zigbee技术实现无线通信的智能语音家居控制系统,具有语音识别,电子万年历、语音开关控制常用电器等功能.本系统可以应用于家居、办公室等场所,具有操作简单,提示人性化,适用性广等特点.  相似文献   

16.
语音机器人由一块单片机和机器人机械框架组成(包括用于走路的电机、用于头部旋转的电机、用于加速和用于弹射的电机等),可以让机器人在语音指令控制下实现多项功能,而软件设计是基于单片机强大的语音控制功能完成机器人语音控制动作的,其中包括主程序、机器人动作控制子程序、语音播放子程序及语音识别程序。  相似文献   

17.
传统的机器翻译模型均基于无噪声环境,即输入的数据是无错误的.但在实际同声传译中,语音识别不可避免会存在错误,这些错误在机器翻译过程中会直接影响其他内容的翻译.因此,统计分析语音识别错误的种类及产生的影响对提高机器翻译的鲁棒性具有指导意义.为了模拟真实语音识别错误,本文通过人工朗读NIST汉英实验测试集,并采用讯飞语音识别系统获取其语音识别结果进行统计分析,主要包括:1)语音识别错误的词性分析;2)语音识别错误的类型分析;3)语音识别错误对翻译性能的影响;4)语音识别错误对其他词翻译的影响.得出的主要结论为:名词和动词出现语音识别错误的次数较多,人名最易出现语音识别错误;同音异形字的语音识别错误出现次数最多;长度较小的句子在翻译时受到语音识别错误影响的程度更加明显;与语音识别错误词距离更近的词的翻译更易受到影响.  相似文献   

18.
随着信息和计算机技术的飞速发展以及对更高效便捷的教学方式的追求,人们对多媒体教学系统的安全性与智能性提出了更高的要求.由于现有的多媒体教学系统太过传统并不适应信息时代新型教学方式的需求,而且部分教师对当今多媒体教室的使用不是特别熟悉,教学设备也不够智能,未能充分利用人脸等生物特征,缺乏语音识别交互命令功能,在教学演示的智能性上也有待提高.针对这一现状,本文设计并实现了基于人脸与语音识别的智慧教室系统,该系统基于Python语言开发,利用树莓派完成对硬件的控制,使教师在上课时可以利用语音来控制教室中所有的设备,提高上课效率.  相似文献   

19.
在嵌入式系统下借助语音识别技术设计一套无线控制系统,通过此系统对传统家电进行一些常规的语音与界面人机交互操作,实现包括多设备交互控制、网络连接、数据显示等功能,这将极大提升家居生活的便利性和舒适性。系统采用基于高级精简指令集机器(advanced RISC machine,ARM)处理器+Linux+语音识别库+无线传感器网络的方案,主要包括硬件电路设计和软件开发,控制系统利用语音识别技术对声音进行识别,借助ZigBee模块进行主控系统与终端设备的交互。与传统产品相比,该交互式家居语音控制系统提供多样的识别、交互模式,创新的控制模式及更大范围的识别距离。  相似文献   

20.
本文研究了以S3C2440为核心的具有语音无线控制功能的机器人的工作原理、系统组成、硬件电路和软件设计方法.创造性地引入了SPY0029语音芯片电路,与ZigBee模组相结合,使本系统具有语音和无线传输控制功能,适于在特殊环境下和特殊人群使用,更具有便捷性和创新性.同时,提出了一种通过语音无线控制机器人动作的实现方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号