首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
语言是人类最自然便捷的沟通手段,是人类之间进行交流的重要表达方式。语音交互技术在智能机器人的应用,主要是通过语音输入设备输入语音,再通过相应的软件、程序等使计算机分辨出人类语音的内容,实现人与计算机之间的交互。基于语音的机器人交互技术,主要包括语音采集、语音识别、语音合成等关键技术环节。因此,本文从语音采集、语音合成、语音识别三个分支通过历年申请量、区域分布、技术活跃度、主要申请人以及技术演进等角度,对智能机器人语音交互的专利进行了梳理,以期对智能机器人语音交互专利进行深入分析,为机器人语音交互技术领域提供技术发展方向和专利布局指导。  相似文献   

2.
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键词识别率.  相似文献   

3.
自动语音识别(Automatic Speech Recognition,简称ASR)系统是一种可以识别非限定讲话者连续话音的识别软件系统,其目标是将人类的语音中的词汇内容转换为计算机可读的输入。呼叫中心则是基于现代通讯技术,同时处理大量各种不同的电话呼入和呼出业务与服务的系统。本文将介绍如何利用东进D081A模拟中继语音卡电话处理系统和Nuance Recognizer 9.0自动语音识别系统实现基于自动语音识别的IT运维呼叫中心系统。  相似文献   

4.
<正> 靠口诉方式输入数据要比用键盘输入数据方便得多。通过语音输入数据,可以解脱操作员的双手和双眼,以便从事其它活动。这对于促进计算机技术的发展具有重大意义。但是,对于制造厂家来说要能够使语音输入数据的方法得到广泛应用,需要解决语音识别和避免语音失误这两大难题。一、语音识别  相似文献   

5.
提出了一种基于蚁群聚类神经网络的汉语耳语音声调识别方法.根据耳语音发音特点,以听神经平均发放率、幅值包络、共振峰、声道长度等构成的多维矢量描述声调特征,采用蚁群聚类算法将多维特征矢量聚类后,送入局部有监督特征映射神经网络进行声调识别.这一方法通过对特征参数的聚类压缩了神经网络的输入神经元数目,因而可以有效避免在大数据条件下神经网络不易收敛及速度慢的问题.对多人耳语音声调的识别实验显示,采用蚁群聚类神经网络的耳语音声调识别方法与传统方法相比,性能明显提高,平均正识率达到87.5%.  相似文献   

6.
语音识别技术应用的进展   总被引:3,自引:0,他引:3  
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率。同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中。语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展。一、语音识别技术的第一次发展语音技术的发展始于20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语…  相似文献   

7.
通过有限元法建立了刚性路面脱空的计算模型,提出采用基于集成神经网络技术对刚性路面脱空状况进行识别,通过刚性路面脱空输入特征向量的组合,用各子神经网络对刚性路面脱空进行初步缺陷识别,然后对识别结果进行决策融合,给出了系统的实现策略和子网络的组建原则。数值模拟结果表明,采用本识别方法合理地选取了各种输入特征向量,具有更好的识别效果.  相似文献   

8.
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统.实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率.同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中.语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展.  相似文献   

9.
针对现有计算机语音识别的缺陷,提出一种模仿人耳听觉特性的Mel频率倒频谱特征,对它与现有的线性预测倒频谱特征进行实验对比研究,表明将人耳听觉特性应用于计算机语音识别,能产生更高的识别精度。  相似文献   

10.
针对传统的语音端点检测方法在强噪声环境下的可靠性会急剧下降问题,提出了一种改进的基于交叉熵的语音端点检测方法。该算法以子带交叉熵为语音/非语音的区分特性,采用基于语音存在概率的算法对背景噪声进行估计,将每帧语音与估计噪声的频谱划分成若干个子带,计算出每个子带能量与背景噪声之间的交叉熵,根据各帧交叉熵的值对输入的带噪语音进行端点检测。实验结果表明,该算法能够有效地区分语音和非语音,在强噪声环境下依然能够保持较高的检测率,与传统算法相比,具有鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号