首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 320 毫秒
1.
自动语音识别(ASR)技术目前已发展得较为成熟,通用ASR引擎已经广泛应用于交通、医疗、通信等行业。但是,由于行业专有词汇在大规模训练语料库中呈非独立同态分布,通用ASR引擎在各细分行业转写时存在对行业专有词汇识别准确率低的问题。相较于互联网环境的16 kHz音频采样率,电话呼叫中心语音为窄带低采样(采样率8 kHz),转写后精度下降尤为明显。为了提高行业词汇的语音转写准确率,文中提出一种基于行业词表的ASR转写后优化技术。首先,对语料库文本数据分别采用卷积神经网络模型和深度神经网络BERT模型进行预测分词,生成行业纠错词表。随后,在生产环境中,使用通用ASR引擎对电话呼叫语音数据进行初始转写。然后,对一次转写后的文本,通过Soft-Masked BERT模型结合纠错词表实现文本数据的纠错,从而提高语音识别准确率。使用广州12345热线客服通话语音数据进行训练和测试,结果表明,使用文中的转写后优化技术可以将通用ASR引擎的行业用词转写准确率提高约10个百分点,且纠错速度较快,具有良好的适用性。  相似文献   

2.
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据.  相似文献   

3.
本文简要地分析了当前呼叫中心中传统IVR系统存在的问题,介绍了语音识别技术在呼叫中心的作用,阐述了利用Asterisk的拨号方案和AGI接口开发语音识别功能的原理,最后给出了在AGI程序中调用语音识别引擎实现呼入用户语音信息识别的过程.  相似文献   

4.
对基于ADSP2186的语音识别电话的硬件结构作了简明的介绍,并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。  相似文献   

5.
VoiceXML语音应用程序使人们可以通过电话查询网络上的信息和服务,实现了语音网络和数据网络的融合,是电子商务今后发展的一个方向。本详细地介绍了VoiceXML语音应用程序的开发过程,并给出了一个语音购物网站的具体实现方法。  相似文献   

6.
介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人的语音对话和语音控制。  相似文献   

7.
本文简要介绍了语音识别电话的识别算法CDD—SPM及其硬件结构,并详细介绍了CDD-SPM在语音识别电话上用ALEP2186的汇编语言实现的过程。  相似文献   

8.
董万杰  刘红霞 《科技信息》2010,(16):199-200
城市客运市场随着城市建设规模增大迅速发展,为加强城市客运管理,提高服务质量,应用先进的计算机和通信技术辅助于城市客运的服务管理工作。并能够通过电话按键实现电话语音录音、语音播报、信息查询以及语音识别等功能,人们可以利用电话实时了解和查询城市客运的有关数据和信息,满足城市居民交通服务需求。  相似文献   

9.
提出并实现了利用微软的语音识别引擎,通过受限的汉语语法分析和概念/关系分析,最终形成驱动指令,实现世博虚拟游历游戏的受限汉语语音识别及驱动技术。使用键盘及鼠标等输入设备有困难人群也可以无障碍的虚拟游历2010年世博园。  相似文献   

10.
详细介绍了基于电话语音卡的语音邮件网关(Telephone Voice Email Gateway,TVEG)的设计及实现,阐述了电话语音邮件网关的硬件平台和软件结构;软件系统采用了Microsoft的Visual C 6.0开发平台,通过对MIME邮件协议的分析,实现对语音邮件的解析与合成.设计完全符合MIME规范,并具有良好的可扩展性.本系统成功地将计算机和电话机的优势有机地结合起来,实现了电话语音格式的邮件在电话线路上传输,提供了一个全方位的交叉的通信平台,拓宽了E-mail的应用领域.  相似文献   

11.
采用模糊切分实现非特定人连接数字语音识别   总被引:1,自引:0,他引:1  
选用倒谱特征、△倒谱特征、能量类特征等多个语音信号特征,采用多码本和HMM/VQ技术实现非特定人连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

12.
介绍了国内外语音翻译系统的研究现状,分析了语音翻译系统的基本特点和工作原理,并结合作者在汉语语音识别与合成、英汉机器翻译等方面的工作,探讨了英汉语音翻译系统的设计与实现中的一些关键问题。  相似文献   

13.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

14.
VoiceXML语音应用程序使人们可以通过电话查询网络上的信息和服务,实现了语音网络和数据网络的融合,是电子商务今后发展的一个方向.本文详细地介绍了VoiceXML语音应用程序的开发过程,并给出了一个语音购物网站的具体实现方法.  相似文献   

15.
语音识别技术被广泛应用到各个领域,而利用单片机来实现语音识别成为一种经济快捷的应用方案。该文从介绍语音识别的基本原理出发,论述了利用单片机实现语音识别技术的硬件基础及软件基础,并且通过一个典型的应用实例来说明其应用方法及技巧。  相似文献   

16.
赵亮  李庆国 《山东科学》2000,13(2):53-56
以8031单片机为核心,设计了用于电话转接的数字语音识别系统-电话分线器,对语音识别技术的应用进行了有益的尝试。  相似文献   

17.
基于电话网络的数据查询语音系统的一般实现及应用,提出了基于语音MODEM的低成本实现方案,给出了程序实现流程图,并重点解决了语音处理的连续性问题。在语音信息服务领域具有较好的应用价值。  相似文献   

18.
语音识别、语音合成技术实现了人和机器人之间的接口。语音识别芯片AP7003完成语音识别和语音合成的应用使智能机器人的智能化程度显著提高。  相似文献   

19.
智能电话语音招生系统的开发与应用   总被引:2,自引:1,他引:1  
智能电话语音招生系统利用现有发达的电话网,跟踪和吸收了发达国家的先进技术,采用了计算机网络、数字信号处理、语音处理、多媒体等技术及开放式系统结构设计而成的.系统不仅能随时回答考生及家长提出的各种问题,同时也大大减轻了人工的负担,提高了工作效率.  相似文献   

20.
为改善IP电话的话音服务质量问题, 设计一种集无线数字语音的实时交互和语音记录功能于一体的具有良好音质的嵌入式语音终端。选取ARM Linux嵌入式系统作为语音通信的平台, 利用流媒体协议进行WiFi网络环境下数字语音的实时传输, 采用Speex语音引擎实现数字音频的编解码, 并利用Speex的预处理功能和回声消除功能提高话音的质量。测试结果表明, 当通信距离小于20 m时, 该语音交互系统具有良好的实时性, 话音流畅, 并且具有高质量的音质, 消除了通话中的回音并使噪声得到很好抑制。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号