首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
把语音信号转变为相应的文本或命令的高技术,让机器通过识别和理解语音、听懂人类的语言。  相似文献   

2.
语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.该文介绍了语音识别发展的过程,语音识别系统的结构和识别过程,模式识别理论和技术在语音识别研究中的应用以及语音识别中的关键技术和面临的问题.最后讨论了语音识别技术存在的优点和不足,并展望了其应用研究的前景.  相似文献   

3.
通过应用语音识别技术、实时翻译技术、语音朗读技术,构建出一个能适应不同口音、翻译准确、发音专业的虚拟现实远程会议实时翻译应用。在煤矿虚拟现实远程会议中,发言者的口授内容和识别后的文本内容会上传至"煤矿虚拟现实远程会议云服务器",当其它与会者所持语种与发言者不同时,识别后的文本会自动翻译为对应语种文本并朗读出来,从而实现与会各方的无缝沟通。该技术已在煤矿虚拟现实远程会议中得到验证。  相似文献   

4.
语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手机语音笔记。商品订单查询的语音功能提供了更为便捷的个性化操作。手机语音笔记的主要功能包括单人录音和多人协作录音,尤其是多人协作录音实现了多人语音交流的记录和分享。这两款手机软件具有一定的实际应用价值。  相似文献   

5.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

6.
梁家恩 《华东科技》2014,(10):38-39
语音如何入侵智能生活?通过智能语音将用户和智能生活连接起来,企业和用户通过云知声的智能语音服务在手机、智能家居、智能汽车、智能客服、在线教育等生活的方方面面带来高效和令人满意的智能化操作体验。语音不仅是人类之间进行信息交流最自然、最有效、最方便的工具,而且也是人与机器之间进行通信的重要工具。语音识别(Automatic Speech Recognition,ASR)技术能够让机器听懂人的声音,并据此作出正确的反应。2011年Siri的出现让语音技术渗透进人们的生活,也将语音识别带入了新纪元。此前,"人机交互"一直只是个虚拟概念。  相似文献   

7.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

8.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高.  相似文献   

9.
首先阐述了在多媒体作品中应用语音识别和智能阅读技术的基本思想,其次介绍了在多媒体作品中应用语音识别和智能阅读技术的实现方法,然后以简单的示例说明利用VB多媒体开发系统开发具有语音识别和文本阅读器的设计方法.  相似文献   

10.
该文介绍了语音识别技术的基本原理,以现代智能家居为背景,将非特定语音识别技术应用于智能家居控制系统中。通过非特定人语音识别技术,该系统能够正确地识别出人的语音控制命令,进行家电设备的智能语音控制,实现家电设备控制的智能化、便捷化。  相似文献   

11.
在嵌入式系统下借助语音识别技术设计一套无线控制系统,通过此系统对传统家电进行一些常规的语音与界面人机交互操作,实现包括多设备交互控制、网络连接、数据显示等功能,这将极大提升家居生活的便利性和舒适性。系统采用基于高级精简指令集机器(advanced RISC machine,ARM)处理器+Linux+语音识别库+无线传感器网络的方案,主要包括硬件电路设计和软件开发,控制系统利用语音识别技术对声音进行识别,借助ZigBee模块进行主控系统与终端设备的交互。与传统产品相比,该交互式家居语音控制系统提供多样的识别、交互模式,创新的控制模式及更大范围的识别距离。  相似文献   

12.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

13.
基于SQLite技术的汉语语音识别数据库的建立   总被引:1,自引:1,他引:0  
建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明:一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。  相似文献   

14.
利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的分类超平面,并且自动优化参数,结合实际的识别结果文本集测试了改进的SVM性能,同时实现了KNN和贝叶斯分类算法,对3种分类性能进行了评价.  相似文献   

15.
利用基音特征参数和共振峰特征参数提取方法,分析研究了不同情感状态的语音信号,并应用模板匹配方法对语音信号进行识别,其原理和实现方法通俗易懂,便于理解,为语音信号的情感识别技术提供一定的判断指标。  相似文献   

16.
基于Speech SDK的语音应用程序实现   总被引:6,自引:0,他引:6  
利用Microsoft Speech SDK的API for Text-to-Speech和API for Speech Recognition,采用Visual Basic 6.0语言,建立文本语音转换应用程序和实现语音识别程序,简单地实现了语音识别的功能,识别出来的内容即可保存为文件,也可作为命令使用,让计算机执行某项操作。  相似文献   

17.
噪声鲁棒性问题是当前语音识别的一个重点,作者提出了一个在已有数据库下通过人为地将噪声和语音信号混合的方法,实现实际环境下的连续英文数字语音识别系统.即通过自设计的程序将采集到的噪声文本根据不同的信噪比随机地添加到现有的语音数据库的语音文本中,使新的数据库中的语音文本符合实际的语音环境.实验结果表明,本系统对带噪声环境下的英文数字的识别率效果好,单词的总体正确识别率达到95.86%.  相似文献   

18.
目的 研究设计基于B/S模式的与文本相关嵌入式说话人语音身份认证系统.方法 针对网络数据传输的噪声环境、语音识别算法的复杂度和大量用户远程实时认证的需求等问题,首次利用了MPC850微控制器和EP2C35 FPGA芯片,采用2代小波降噪,语音增强,声谱中主要参数分布估计,加权MFCC语音特征提取,与指定文本相关的混合HMM辨识等技术完成设计要求.结果 给出了系统SOC实现方法 ,讨论了语音特征提取算法的原理及改进措施.结论 该系统能有效地完成基于B/S模式远程说话人身份认证,具有较高的实践应用价值.  相似文献   

19.
与传统的门锁相比,嵌入式语音门锁利用人的语音作为“钥匙”,通过对语音内容和声音特征的双重识别,实现对出入口的控制和管理,其具有成本低、使用方便、保密性好等优点.以单片机SPCB061A为平台,利用语音识别技术设计了一个安全、方便的嵌入式语音门锁.  相似文献   

20.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号