共查询到20条相似文献,搜索用时 31 毫秒
1.
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统.实验室语音识别研究的巨大突破产生于20世纪80年代末,一些小词汇量的识别系统具备了较高的识别率.同时,人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中.语音识别技术获得突破的主要原因在于半导体技术、软件技术和存储技术突飞猛进的发展. 相似文献
2.
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键词识别率. 相似文献
3.
4.
5.
6.
7.
本设计完成一款基于32位单片机S1C33L05和zigbee技术,利用ICRoute公司的高性能芯片LD3320A实现非特定人语音识别,以zigbee技术实现无线通信的智能语音家居控制系统,具有语音识别,电子万年历、语音开关控制常用电器等功能.本系统可以应用于家居、办公室等场所,具有操作简单,提示人性化,适用性广等特点. 相似文献
8.
9.
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检... 相似文献
10.
在语占识别系统中,都是通过提取特征向量来计算待识语音与模型之间的概率或距离,然后根据最大概率或最小距离判断待识语爵的类别.对大量实验数据的观察发现:特征向量的各维对语音的表达能力是不一样的,同时特征向星在语音的时间轴上表达能力也不一样。根据这种特性,提出了三种训练算法:在训练中计算出加权矩阵,以此来加强易混淆数字间的本质区分特征,减弱随机特征,在汉语数字串识别实验中,得到了比较理想的实验结果,错误下降40.8%,系统识别率上升到94.08%。 相似文献
11.
随着语音控制技术的广泛使用,嵌入式的智能语音控制技术已经成为目前语音控制技术的应用热点。本文通过分析语音控制的基本原理,以凌阳SPCE061A单片机为基本载体,设计了智能小车语音控制系统。实验证明,在该语音控制系统下的小车能够准确识别语音,反应快速灵敏。同时,简洁的外围电路设计以及廉价的凌阳单片机可以有效地降低智能车的成本。 相似文献
12.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法. 相似文献
13.
医用多媒体诊断源于医学影像存储与归档系统(PACS),PACS的概念提出于20世纪80年代初.建立PACS的想法主要是由两个主要因素引起的:一是数字化影像设备,如CT设备等的产生使得医学影像能够直接从检查设备中获取;另一个是计算机技术的发展,使得大容量数字信息的存储、通讯和显示都能够实现.随着技术的发展,到20世纪90年代初期已经陆续建立起一些实用的PACS. 相似文献
14.
医用多媒体诊断源于医学影像存储与归档系统(PACS),PACS的概念提出于20世纪80年代初。建立PACS的想法主要是由两个主要因素引起的:一是数字化影像设备,如CT设备等的产生使得医学影像能够直接从检查设备中获取;另一个是计算机技术的发展,使得大容量数字信息的存储、通讯和显示都能够实现。随着技术的发展,到20世纪90年代初期已经陆续建立起一些实用的PACS。 相似文献
15.
16.
理论联系实际作为学哲学、用哲学、讲哲学的一个根本方法早已为人们共识。但为什么要联系实际,联系什么,怎样联系,却还有待于进一步说明。下面就这几个问题谈点看法。一,应当密切联系自然科学发展的实际。哲学只有站在时代的高度,不断概括总结自然科学发展成果,才能实现自身的现代化。自然科学发展到今天,可以说每一次重大的历史性突破,都曾经对哲学的发展产生过巨大影响,起到重要的推动作用。19世纪40年代自然科学上的三大发现揭示了自然界普遍联系和辩证发展的生动图景,从而为辩证唯物主义的产生提供了自然科学前提。20世纪初相… 相似文献
17.
18.
语音合成技术在软件开发中的应用 总被引:2,自引:0,他引:2
采用MS Speech SDK开发语音系统与C++开发,利用Speech API高级接口的文转换部分(SS)相应的API函数以及Speech SDK所提供的语音库,实现文字到语音的输出与控制。完成了对系统级键盘输入的抓取及语音输出、对焦点窗体的辨别及语音提示,实现文件的朗读。突破了函数修改的难题,实现了语音系统操作平台的设计目标。 相似文献
19.
针对关键词识别中基于后验概率的置信度方法对语音发音变化信息利用不充分的问题,提出了一种基于时长和边界信息的置信度. 该方法引入一个松弛因子,灵活地选择词信息相同的弧段计算置信度,从而进行关键词拒识. 在此基础上,设计并实现了一个基于Lattice 的大词表语音关键词检测系统,先用改进的动态规划算法在音节网格上进行关键词检出,尽可能多地给出关键词候选,然后采用基于时长和边界信息的置信度进行关键词确认. 实验结果表明,该方法相对于主流的计算方法,系统的等错误率(equal error rate,EER)提高了7%. 相似文献
20.