首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 72 毫秒
1.
基于Speech SDK的语音应用程序实现   总被引:6,自引:0,他引:6       下载免费PDF全文
利用Microsoft Speech SDK的API for Text-to-Speech和API for Speech Recognition,采用Visual Basic 6.0语言,建立文本语音转换应用程序和实现语音识别程序,简单地实现了语音识别的功能,识别出来的内容即可保存为文件,也可作为命令使用,让计算机执行某项操作。  相似文献   

2.
Authorware是Macromedia公司的多媒体开发工具,提供了丰富的交互方式,但是并没有提供语音交互,微软公司提供的免费语音开发包Speech SDK5.1里面提供了语音识别和语音合成的二次开发平台,以《小学英语单词人机对话》课件为例详细论述了Authorware中结合MS Speech SDK 5.1制作英语人机对话多媒体课件的方法.  相似文献   

3.
Spark SDK是L&H公司推出的可进行二次开发的语音识别软件 ,它提供了一种快速简便的方法 ,使开发人员可以将语音部分识别功能添加到他们的应用程序中。在雷达情报口报录取器中 ,利用Spark SDK实现连接数字语音识别 ,并通过编写识别专业词汇的函数以及修改Spark SDK的语法规则等方法提高了语音识别软件的识别率。  相似文献   

4.
利用多媒体网格技术、TTS技术、Microsoft Speech SDK语音开发包,开发了基于多媒体网格的语音导航教学辅助系统。文中首先介绍了多媒体网格技术,其次对系统应用平台、系统资源管理架构和系统功能进行详细论述,最后给出了系统关键技术以及实现方法。该系统在特殊教育信息无障碍的应用领域中具有一定指导意义和实际的应用价值。  相似文献   

5.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

6.
本文描述了分布式语音识别(Distributed Speech Recognition)技术的原理、先进性及其在3GPP体系中的应用,重点描述了3GPP协议栈体系下的集成语音识别框架SRF及语音识别框架SRF在3GPP体系中对多模式和多设备服务提供基本支持的体系结构。  相似文献   

7.
基于Microsoft Speecd SDK 5.1实现中英文朗读   总被引:1,自引:0,他引:1  
对如何利用Microsoft Speech SDK5.1实现中英文混合文本朗读进行了研究,解决了中英文朗读时不能真正朗读英文的问题,提出了一种根据文本类型和系统消息实时切换中英文引擎的方法,实现了中英文朗读时引擎的自动平滑切换.朗读效果良好,对于实现人机之间人性化交流具有积极的意义.  相似文献   

8.
语音识别、语音合成技术实现了人和机器人之间的接口。语音识别芯片AP7003完成语音识别和语音合成的应用使智能机器人的智能化程度显著提高。  相似文献   

9.
梁家恩 《华东科技》2014,(10):38-39
语音如何入侵智能生活?通过智能语音将用户和智能生活连接起来,企业和用户通过云知声的智能语音服务在手机、智能家居、智能汽车、智能客服、在线教育等生活的方方面面带来高效和令人满意的智能化操作体验。语音不仅是人类之间进行信息交流最自然、最有效、最方便的工具,而且也是人与机器之间进行通信的重要工具。语音识别(Automatic Speech Recognition,ASR)技术能够让机器听懂人的声音,并据此作出正确的反应。2011年Siri的出现让语音技术渗透进人们的生活,也将语音识别带入了新纪元。此前,"人机交互"一直只是个虚拟概念。  相似文献   

10.
对如何利用Microsoft Speech SDK 5.1实现中英文混合文本朗读进行了研究,解决了中英文朗读时不能真正朗读英文的问题,提出了一种根据文本类型和系统消息实时切换中英文引擎的方法,实现了中英文朗读时引擎的自动平滑切换.朗读效果良好,对于实现人机之间人性化交流具有积极的意义。  相似文献   

11.
近年来,计算机技术飞速发展,通过计算机的言语分析软件对动态病理言语评估更具有客观性和稳定性.文章介绍美国Kay公司生产的言语运动分析软件(MSP),该程序能够提取有关言语障碍的声学参数,将患者的语音通过软件分析处理,与正常人标准样本对比,总结出带有图形和数值信息的综合性报告,从而达到评估动态病理言语的目的,为临床诊断和治疗提供了依据.  相似文献   

12.
采用STC11L08XE单片机作为主控制器,以LD3320芯片作为外扩语音控制器件,实现语音辨识功能和对空调运行状态的控制,如启动、停止、功能转换、温度调节、定时开关等.该语音控制系统由语音辨识模块、红外线传输模块、LED指示灯模块及按键触发模块组成.根据非特定人声语音辨识方案,设计相应的语音识别程序,并将语音控制系统模块集成到具有红外传输功能的空调遥控器电路中.实验结果表明,根据初始设定的语音命令可实现系统对空调的语音控制,该系统在一定距离范围内具有较高的识别率.  相似文献   

13.
基于VB和SpeechSDK设计了一种课堂随机语音点名系统。该系统能够通过文本格式的学生名单建立点名列表,随机选择学生,并通过语音播报其学号和姓名。为防止在随机过程中出现重复点到的情况,采用双列表的方法将点中的学生暂时移出点名列表。利用在数字之间插入空格的方法.解决了语音播放学号时无法分别读出每个数字的问题。该语音点名系统目前已经在课堂上投入使用并取得了较好的反响。  相似文献   

14.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

15.
本文研究了简易的语音信号处理系统.着重介绍了语音信号的分析和基频检测技术.本文为一般人语言音调语调、聋哑儿童的语言训练的研究和实验,提供了可视式硬件基础,对类似语音信号处理系统有一定的参考价值.  相似文献   

16.
本文介绍一种用于话音内插系统(Speech Interpolation System)的高灵敏度话音检测器,并用该检测器进行了各种话音瞬态参数的统计分析。该话音检测器通过分析输入信号的短时能量和零交叉率等检测话音信号,采用自适应电平门限和释放延迟等措施提高了话音检测器的灵敏度和可靠性。同时,这种方案对于线路中的信令信息有较强的识别能力。采用本话音检测器对话音信号所做的统计分析不仅得到了具有一定价值的汉语活动规律,而且进一步完善了检测方案。同时,通过汉语和英语话音活动规律的比较表明汉语应用话音内插技术的效果要优于英语。  相似文献   

17.
本文研究了简易的语音信号处理系统。着重介绍了语音信号的分析和基频检测技术。本文为一般人语言音调语调、聋哑儿童的语言训练的研究和实验,提供了可视式硬件基础,对类似语音信号处理系统有一定的参考价值.  相似文献   

18.
Digital mobile telecommunication systems, such as the global system for mobile (GSM) system, want to further improve speech communication quality without changing the channel encoders and decoders. Speech quality is most affected by residual bit errors in received speech frames. Conventional methods use binary decision strategies for error detection and concealment in frames. This paper presents a multi-level error detection and concealment algorithm for GSM full rate speech codec systems. The algorithm use...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号