首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
可穿戴设备和智能家居系统需要语音识别引擎占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源系统的这种需求。该文针对小资源下语音识别系统,在解码策略和拒识算法设计上均提出了改进方法。在解码策略上,通过修改垃圾音素的重入,使得集外语音的拒识率提高到64.8%,而内存占用只增加了8.5kB。在拒识算法上,提出了离线计算背景概率和在线查表的方法,与基线系统相比,在集内识别率略有损失的情况下,集外拒识率达到93.8%,而内存占用和计算速度也得到了优化。  相似文献   

2.
设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统.本语音识别系统的语音库包括8 400个电视机转台控制命令的语音数据.在无噪环境下对特定语音命令的识别率可达93.2%,正常电视背景环境下的识别率降至49.0%,对电视背景下通过分离后的语音命令识别率可达85.8%.  相似文献   

3.
采用模糊切分实现非特定人连接数字语音识别   总被引:1,自引:0,他引:1  
选用倒谱特征、△倒谱特征、能量类特征等多个语音信号特征,采用多码本和HMM/VQ技术实现非特定人连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

4.
选用倒谱特征、△倒谱特征、能量类特征等个语音信号特征,采用多码本和HMM/VQ技术实现非特定连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

5.
汽车噪声中自动语音的识别技术   总被引:6,自引:0,他引:6  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

6.
连接数字语音识别系统的DSP实时实现   总被引:2,自引:0,他引:2  
:针对各种数字信息,实现了一种基于TMS320C5x 评价模块(EVM)的与特定人无关的连接数字语音识别系统.在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum -Welch 重估算法,有效地提高了系统的识别率.给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响.在具体实现中,着重处理了抗噪及实时实现问题.实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到92% ,为其实用化提供了较为重要的技术途径.  相似文献   

7.
由于战场使用环境的特殊性,环境噪声成为军事命令语音识别技术实用化的一个主要障碍。该文利用模型补偿技术,对噪声环境年军事命令语音识别进行探索。重点研究噪声环境下的并行模型组合算法(PMC),详细论述其原理以及在噪声环境下的语音识别中的应用。实验使用了48个高炮射击口令,分别在3种不同噪声,不同信噪比条件下对该方法进行识别率测试,结果表明,该方法具有一定的实际应用价值。  相似文献   

8.
语音识别是当今信息领域标志性技术,是最具发展前景的综合性学科之一。该文用语音识别系统模式匹配原理,对比分析了模板匹配算法DTW与人工神经网络中的ANN算法在语音识别据识中的应用;提出了一种基于单个神经元的拒识算法,实验结果表明该算法能达到较高的拒识率。  相似文献   

9.
介绍了一个在微机上实现的有限词,特定人语音识别系统,该系统采用连续,M元高斯混合密度的隐式马尔柯夫模型(CDHMM)为识别方法,以修改后的BaumWelch方法为训练重估算法,文中提出了对语音特征矢量非线性归一化预处理,和对训练数据不足的HMM模型特征空产是进行后处理修正的算法,还提出了一种基于语音知识的模型初始化的方法,经实验证明,系统的识别率可以达到90%以上。  相似文献   

10.
利用段长信息的改进连续语音识别算法   总被引:1,自引:1,他引:1  
以基于段长分布的隐含Markov模型为基础,提出了一种改进的帧同步束搜索连续语音识别算法,使段长信息在连续语音识别中得到充分有效的利用,并与原算法作了比较。在该算法的具体实现上,建立了状态的局部路径组和全局活跃路径两种数据结构,并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验,实验结果表明,利用段长信息改进识别算法比原识别算法字的误识率降低了6%。  相似文献   

11.
深度神经网络技术在汉语语音识别声学建模中的优化策略   总被引:1,自引:1,他引:0  
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。  相似文献   

12.
以模糊集理论为基础,提出了一种汉语指令识别的模糊语音描述和模糊匹配算法,在语音信号的时间规整中,使用一种改进的非线性帧数规整算法,在40条指令的识别实验中,正确率达93%以上。  相似文献   

13.
 数据存储系统是电话录音监控系统的重要组成部分之一.存储系统的研究主要包括系统设计和存储调度算法研究两方面.针对电话录音监控系统应用的特点,提出了一种基于顺序存储介质——磁带的电话语音数据存储系统设计方法,并给出了在该系统下进行语音数据文件查询的算法.  相似文献   

14.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

15.
嵌入式中等词汇量英语语音识别片上系统   总被引:1,自引:0,他引:1  
针对目前嵌入式英语语音识别系统中识别性能较差或硬件资源占用较大的问题,提出了一个在16 b定点数据信号处理语音芯片上实现的非特定人、中等词汇量英语命令字识别系统。该系统采用基于连续隐含M arkov模型(con tinuous dens ity h idden M arkov m ode l,CDHMM)的两级识别网络,通过应用改进的音素体系、B ayes ian信息准则模型参数选择算法、决策树和数据驱动相结合的状态聚类方法、最小互信息改变准则特征选择算法,在保证识别率的前提下,大大降低了模型的存贮空间和计算复杂度。实验表明,对1 235词的英语短句的识别率为96.41%,识别时间为0.46倍实时。  相似文献   

16.
智能小车目标识别跟踪系统的实现   总被引:3,自引:0,他引:3  
对目标识别与跟踪技术进行了分析,在此基础上结合智能小车目标跟踪系统的开发,详细讨论了特定目标跟踪系统的具体实现方法、数字图像处理在目标识别中的应用以及小车智能控制的软、硬件设计.该系统通过配置在智能小车上的摄像头,采用数字图像处理技术对特定目标进行识别,在目标运动过程中,通过单片机接收计算机发出的命令控制智能小车跟踪目标,在没有人为干预的情况下,能够自主运行,稳定地跟踪目标.该设计为生长机器智能系统提供了一个研究平台.  相似文献   

17.
为了提高两个说话人情况下电话语音双人检测的性能,提出了一种基于长时距离与短时距离之和的双人语音分段算法,并对分段过程中的聚类过程进行了改进。对于分段得到的语音采用基于GMM-UBM(Gaussian mixturemodel-universal background model,GMM-UBM)模型的说话人确认算法,构成一个电话语音双人检测系统。实验结果表明:在美国国家标准技术局1999年组织的年度说话人识别评测双人检测数据库上的检测等错误率为15.1%。该算法取得了良好的效果。  相似文献   

18.
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.  相似文献   

19.
介绍一种嵌入式语音识别系统的设计与实现,整个系统以TI公司的双核(ARM DSP)处理器芯片OMAP5912为控制核心,采用SENSORY公司的RSC364语音芯片来实现语音的识别与合成,并进行语音信号的采集和播放,整个系统结构简单,集成度高.驾驶员利用该系统可通过语音命令控制车上设备及获得语音反馈信息,系统也可以作为一嵌入式语音设备使用,具有较大的市场应用前景.  相似文献   

20.
This paper presents the first report of a system of human's speech interaction with rats via integration of brain–machine interfaces and automatic speech recognition technologies. We propose a novel human–rat speech interaction paradigm by incorporating speech translator module, which translates human's speech commands into suitable electrical brain stimulation to steer the rat to induce expected locomotor behaviors. The preliminary results show that we can guide a rat's movement by speech commands. We further look into the future application scenarios together with forthcoming challenges facing this newly evolved cyborg intelligent system. This work will pave the way for natural interaction with animal robots.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号