首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汽车噪声中自动语音的识别技术   总被引:5,自引:0,他引:5  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

2.
对地铁列车自动驾驶系统进行分析,并对列车自动驾驶系统的车载设备进行设计.  相似文献   

3.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

4.
车载手势识别中基于小波变换和双边滤波的图像去噪方法   总被引:2,自引:1,他引:1  
手势识别是人机交互中的重要研究领域,车载手势识别系统可以减少驾驶员手动操作仪表导致的分心,提高驾驶安全性。受光照变化、汽车环境、摄像头成像质量等各因素的影响,车载手势图像中常会存在大量复杂噪声。这些噪声严重影响后续手势分割、特征提取和手势识别的准确性。针对手势图像中存在的噪声问题,本文提出了一种适用于车载手势图像处理的新方法。该方法先对小波分解后的各高频子带采用不同方向的一维非线性扩散滤波处理得到初步去噪手势图,在此基础上用多尺度双边滤波对图像再次处理。实验结果表明,本文方法可以较好地去除车载手势图中噪声,抑制车载手势图细节的模糊。   相似文献   

5.
本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍,然后提出了在孤立字词语音识别的一个新的算法,即新型的识别算法。通过此算法,系统可以在不降低系统识别精度的前提下,大大精简运算量,因此提高了识别系统整体的识别效率。实验证明,这种识别算法在基于模板的孤立字词语音识别中可以达到100%的识别精度,在基于非模板的孤立字词的语音识别中,其识别精度也可以达到90%以上,并且与传统的识别方法相比,缩短了训练时间,提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后,枸建一个使用方便的语音识别系统,将本算法应用到实践当中来解决人们现实生活中遇到的各种问题.  相似文献   

6.
介绍一种嵌入式语音识别系统的设计与实现,整个系统以TI公司的双核(ARM DSP)处理器芯片OMAP5912为控制核心,采用SENSORY公司的RSC364语音芯片来实现语音的识别与合成,并进行语音信号的采集和播放,整个系统结构简单,集成度高.驾驶员利用该系统可通过语音命令控制车上设备及获得语音反馈信息,系统也可以作为一嵌入式语音设备使用,具有较大的市场应用前景.  相似文献   

7.
基于SQLite技术的汉语语音识别数据库的建立   总被引:1,自引:1,他引:0  
建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明:一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。  相似文献   

8.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

9.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

10.
语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.该文介绍了语音识别发展的过程,语音识别系统的结构和识别过程,模式识别理论和技术在语音识别研究中的应用以及语音识别中的关键技术和面临的问题.最后讨论了语音识别技术存在的优点和不足,并展望了其应用研究的前景.  相似文献   

11.
一种新型语音识别系统   总被引:1,自引:0,他引:1  
提出一种新型语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别.同时,提出了一种新的抗噪语音识别方法,通过改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好地抑制了噪声干扰,提高了语音识别率.  相似文献   

12.
防止假冒者闯入说话人识别系统   总被引:3,自引:0,他引:3  
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右.  相似文献   

13.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

14.
基于神经网络的语音识别研究   总被引:3,自引:0,他引:3  
由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具.为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较.介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构.其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别.实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%.  相似文献   

15.
飞机驾驶员在飞行过程中有各种各样的说话方式,如带情感的对话、快速与慢速、大声与小声等.并且在飞行的状态下还需要承受物理与心理压力,对话语音还会产生变异,如果不做任何处理,直接用于传统的说话人识别系统以及语音识别系统来处理,性能会比较差.因此,本文对识别飞行员的说话方式(style)这一副语言信息进行了研究,以辅助后续的语音识别系统以及说话人识别系统.实验数据库包含了6 925个样本,实验中提取了384维声学特征,比较了支持向量机SVM不同核函数的分类能力.实验表明,采用高斯径向基函数的SVM具有最好的性能,平均准确率达到91.62%.   相似文献   

16.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用动态时间规整(DTW)方法,可以利用使用过程中的数据不断修正原模板,使模板逐次趋于完善。本文研究了说话人识别的相关技术,提出并设计了一个基于DTW的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

17.
语音识别一直是人类研究的热门问题,目前中文识别技术尚不是很成熟,将中文特有的特点和国际上先进的研究经验相结合,是中文连续语音识别的一个重要的研究方向。而随着物联网和嵌入式设备的发展,在嵌入式产品上实现中文语音识别成为一种发展的趋势。本论文研究和解决的课题是设计一个基于arm9的嵌入式linux语音识别系统。  相似文献   

18.
传统的机器翻译模型均基于无噪声环境,即输入的数据是无错误的.但在实际同声传译中,语音识别不可避免会存在错误,这些错误在机器翻译过程中会直接影响其他内容的翻译.因此,统计分析语音识别错误的种类及产生的影响对提高机器翻译的鲁棒性具有指导意义.为了模拟真实语音识别错误,本文通过人工朗读NIST汉英实验测试集,并采用讯飞语音识别系统获取其语音识别结果进行统计分析,主要包括:1)语音识别错误的词性分析;2)语音识别错误的类型分析;3)语音识别错误对翻译性能的影响;4)语音识别错误对其他词翻译的影响.得出的主要结论为:名词和动词出现语音识别错误的次数较多,人名最易出现语音识别错误;同音异形字的语音识别错误出现次数最多;长度较小的句子在翻译时受到语音识别错误影响的程度更加明显;与语音识别错误词距离更近的词的翻译更易受到影响.  相似文献   

19.
对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。  相似文献   

20.
嵌入式语音识别Mahalanobis距离计算模块   总被引:1,自引:0,他引:1  
为了达到嵌入式语音识别系统低成本、低功耗的目标,提出一种算法硬件映射方法.将基于连续隐含Markov模型语音识别算法中占系统总运算量的50%以上的Mahalanobis距离计算,映射为硬件实现的模块.通过该方法,系统在较低时钟频率下即可完成嵌入式语音识别中实时处理的要求,从而大大降低系统功耗.实验结果表明,该模块在0.18 μm 和舰工艺库下实现,仅需1.2 mm2, 包含64 kb 静态随机存储器.应用该模块可以大大提高嵌入式语音识别系统的性能,达到降低成本,降低功耗的目标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号