首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统.实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率.同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中.语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展.  相似文献   

2.
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键词识别率.  相似文献   

3.
自动语音识别(Automatic Speech Recognition,简称ASR)系统是一种可以识别非限定讲话者连续话音的识别软件系统,其目标是将人类的语音中的词汇内容转换为计算机可读的输入。呼叫中心则是基于现代通讯技术,同时处理大量各种不同的电话呼入和呼出业务与服务的系统。本文将介绍如何利用东进D081A模拟中继语音卡电话处理系统和Nuance Recognizer 9.0自动语音识别系统实现基于自动语音识别的IT运维呼叫中心系统。  相似文献   

4.
采用二阶差分耳蜗模型对语音信号进行特征参数提取,获得了基于听觉谱的语音识别前端特征参数,同时根据听觉谱特征提出了一种"幅和频差积"距离测度,识别算法采用端点放松两帧,路径斜率限制在1/2到2之间的改进型DTW算法.在小词汇量非特定人(SI)的识别环境下,计算机模拟结果表明此法在对0~9十个数字以及小词汇量的SI识别时,其正识率可达98%以上,且具有较好的鲁棒性.  相似文献   

5.
语言是人类最自然便捷的沟通手段,是人类之间进行交流的重要表达方式。语音交互技术在智能机器人的应用,主要是通过语音输入设备输入语音,再通过相应的软件、程序等使计算机分辨出人类语音的内容,实现人与计算机之间的交互。基于语音的机器人交互技术,主要包括语音采集、语音识别、语音合成等关键技术环节。因此,本文从语音采集、语音合成、语音识别三个分支通过历年申请量、区域分布、技术活跃度、主要申请人以及技术演进等角度,对智能机器人语音交互的专利进行了梳理,以期对智能机器人语音交互专利进行深入分析,为机器人语音交互技术领域提供技术发展方向和专利布局指导。  相似文献   

6.
当前,人工智能与云计算不断发展,应用日益普及,为语音技术在医疗领域的应用提供了契机。本文分析了智能语音技术发展现状与关键技术,结合医院口腔门诊业务发展情况,以解决门诊口腔业务中的信息化问题为导向,探索语音识别技术在口腔门诊病历系统中的应用。  相似文献   

7.
本设计完成一款基于32位单片机S1C33L05和zigbee技术,利用ICRoute公司的高性能芯片LD3320A实现非特定人语音识别,以zigbee技术实现无线通信的智能语音家居控制系统,具有语音识别,电子万年历、语音开关控制常用电器等功能.本系统可以应用于家居、办公室等场所,具有操作简单,提示人性化,适用性广等特点.  相似文献   

8.
随着现代科技的发展,智能家居逐渐代替传统家居成为家居界的时尚产业。本文所描述的是基于LD3320语音识别技术的智能家居控制系统。其中,语音识别功能由ICRoute公司生产研发的LD3320语音识别芯片实现,将用户发出的指令经识别后发送中央处理器中,Freescale公司开发的MK60DN512VLQ10微处理器作为中央处理器用于控制室内灯光,温度调节,电器控制以及房间状态参数显示等。经过实验验证,该系统工作稳定,识别率高,具有广泛应用前景。  相似文献   

9.
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检...  相似文献   

10.
在语占识别系统中,都是通过提取特征向量来计算待识语音与模型之间的概率或距离,然后根据最大概率或最小距离判断待识语爵的类别.对大量实验数据的观察发现:特征向量的各维对语音的表达能力是不一样的,同时特征向星在语音的时间轴上表达能力也不一样。根据这种特性,提出了三种训练算法:在训练中计算出加权矩阵,以此来加强易混淆数字间的本质区分特征,减弱随机特征,在汉语数字串识别实验中,得到了比较理想的实验结果,错误下降40.8%,系统识别率上升到94.08%。  相似文献   

11.
随着语音控制技术的广泛使用,嵌入式的智能语音控制技术已经成为目前语音控制技术的应用热点。本文通过分析语音控制的基本原理,以凌阳SPCE061A单片机为基本载体,设计了智能小车语音控制系统。实验证明,在该语音控制系统下的小车能够准确识别语音,反应快速灵敏。同时,简洁的外围电路设计以及廉价的凌阳单片机可以有效地降低智能车的成本。  相似文献   

12.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法.  相似文献   

13.
医用多媒体诊断源于医学影像存储与归档系统(PACS),PACS的概念提出于20世纪80年代初.建立PACS的想法主要是由两个主要因素引起的:一是数字化影像设备,如CT设备等的产生使得医学影像能够直接从检查设备中获取;另一个是计算机技术的发展,使得大容量数字信息的存储、通讯和显示都能够实现.随着技术的发展,到20世纪90年代初期已经陆续建立起一些实用的PACS.  相似文献   

14.
韩萍  曹丹 《河南科技》2006,(12):23-23
医用多媒体诊断源于医学影像存储与归档系统(PACS),PACS的概念提出于20世纪80年代初。建立PACS的想法主要是由两个主要因素引起的:一是数字化影像设备,如CT设备等的产生使得医学影像能够直接从检查设备中获取;另一个是计算机技术的发展,使得大容量数字信息的存储、通讯和显示都能够实现。随着技术的发展,到20世纪90年代初期已经陆续建立起一些实用的PACS。  相似文献   

15.
<正>一、河南省农业节水技术应用现状作为粮食生产大省,河南省的节水灌溉技术应用也较早,早在20世纪60~70年代,河南省各地区就发展了地埋混凝土管道;20世纪70年代后期,河南省一些经济条件较好的地区开始进行喷灌、滴灌等节水技术试验;20世纪80年代,河南省开始大  相似文献   

16.
理论联系实际作为学哲学、用哲学、讲哲学的一个根本方法早已为人们共识。但为什么要联系实际,联系什么,怎样联系,却还有待于进一步说明。下面就这几个问题谈点看法。一,应当密切联系自然科学发展的实际。哲学只有站在时代的高度,不断概括总结自然科学发展成果,才能实现自身的现代化。自然科学发展到今天,可以说每一次重大的历史性突破,都曾经对哲学的发展产生过巨大影响,起到重要的推动作用。19世纪40年代自然科学上的三大发现揭示了自然界普遍联系和辩证发展的生动图景,从而为辩证唯物主义的产生提供了自然科学前提。20世纪初相…  相似文献   

17.
<正> 靠口诉方式输入数据要比用键盘输入数据方便得多。通过语音输入数据,可以解脱操作员的双手和双眼,以便从事其它活动。这对于促进计算机技术的发展具有重大意义。但是,对于制造厂家来说要能够使语音输入数据的方法得到广泛应用,需要解决语音识别和避免语音失误这两大难题。一、语音识别  相似文献   

18.
语音合成技术在软件开发中的应用   总被引:2,自引:0,他引:2  
采用MS Speech SDK开发语音系统与C++开发,利用Speech API高级接口的文转换部分(SS)相应的API函数以及Speech SDK所提供的语音库,实现文字到语音的输出与控制。完成了对系统级键盘输入的抓取及语音输出、对焦点窗体的辨别及语音提示,实现文件的朗读。突破了函数修改的难题,实现了语音系统操作平台的设计目标。  相似文献   

19.
针对关键词识别中基于后验概率的置信度方法对语音发音变化信息利用不充分的问题,提出了一种基于时长和边界信息的置信度. 该方法引入一个松弛因子,灵活地选择词信息相同的弧段计算置信度,从而进行关键词拒识. 在此基础上,设计并实现了一个基于Lattice 的大词表语音关键词检测系统,先用改进的动态规划算法在音节网格上进行关键词检出,尽可能多地给出关键词候选,然后采用基于时长和边界信息的置信度进行关键词确认. 实验结果表明,该方法相对于主流的计算方法,系统的等错误率(equal error rate,EER)提高了7%.  相似文献   

20.
提出了一种基于蚁群聚类神经网络的汉语耳语音声调识别方法.根据耳语音发音特点,以听神经平均发放率、幅值包络、共振峰、声道长度等构成的多维矢量描述声调特征,采用蚁群聚类算法将多维特征矢量聚类后,送入局部有监督特征映射神经网络进行声调识别.这一方法通过对特征参数的聚类压缩了神经网络的输入神经元数目,因而可以有效避免在大数据条件下神经网络不易收敛及速度慢的问题.对多人耳语音声调的识别实验显示,采用蚁群聚类神经网络的耳语音声调识别方法与传统方法相比,性能明显提高,平均正识率达到87.5%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号