首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

2.
清浊音识别在语音处理技术中具有非常重要的意义,其准确度对后续的语音处理有很大的影响.文章根据藏语言文字的特征提取了藏语有声段语音的短时能量、短时过零率以及短时自相关等参数,并通过对语音进行短时时域分析,研究了藏语的清浊音识别方法.实验证明,此方法在藏语辅音字母的清浊音识别中获得良好的效果,该方法为进一步深入研究藏语语音技术提供了一定的参考依据.  相似文献   

3.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

4.
语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。  相似文献   

5.
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。  相似文献   

6.
在藏语语音处理中基音周期的检测具有非常重要的意义.本文首先讨论了用自相关函数法进行基音周期检测的基本原理及其改进方法,进而研究了这种方法在藏语语音处理中的应用,并给出了相应的实例.  相似文献   

7.
语音识别技术研究进展   总被引:2,自引:0,他引:2  
柳春 《甘肃科技》2008,24(9):41-43
文章回顾了语音识别技术的发展历史,综述了语音识别系统的分类、结构及研究的基本方法,并探讨了今后语音识别面临的问题及发展方向。  相似文献   

8.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。  相似文献   

9.
张成  石磊  赵慧然 《科技资讯》2023,(10):253-256
维度语音情感识别是语音识别技术的重要研究方向,提取最能表达语音情感的特征码并构建具有模型泛化性和鲁棒性的声学模型是语音情感识别的重要研究内容。同时,其触及领域具备较强的多样性,心理学、模式识别以及认知科学等均属于其研究范围,而这些模块是其研究的重点,开展研究的目的主要是为了让机器具备人类情感,促使人机交互更加自然灵活。基于此,该文阐述了在情感心理学的研究基础上,分析情感语音数据库与数据标注,并对情感分类与回归加以探索,希望可以为维度语音情感识别提供新的思路。  相似文献   

10.
针对藏语言的特点,提出基于隐马尔可夫过程(HMM)的概率统计模型,用可观测的藏语文本信息预测重音标注,提出了初步设想.  相似文献   

11.
鲁棒语音识别技术综述   总被引:1,自引:0,他引:1  
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.  相似文献   

12.
语音增强是语音识别的重要组成部分,它是将尽可能纯净的原始语音从嘈杂的语音中提取出来。其目的是提高语音质量,从而提高语音识别的准确率。笔者在总结近年来的语音增强的相关算法的基础上,将这些算法进行分类,分为基于数字信号处理的方法和机器学习的方法。本文介绍了基于数字信号处理和基于机器学习的语音增强算法,并总结了几种常用语音增强算法的优缺点,最后提出了语音增强算法进一步研究方向。  相似文献   

13.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

14.
提出了一种基于双权值神经网络的非特定人连续语音识别的新算法.这种算法可以不经过端点检测和分割,构建连续语音中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果.  相似文献   

15.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

16.
藏语语音合成语料库的好坏对合成语音质量有很大的影响。本文介绍了藏语拉萨话语音合成语料库的设计过程,语料的设计考虑了内容上和语义上的完整性,利用Greed算法实现对语料的选取,同时严格按照标准的录音过程对语料进行录制,最后设计了一套韵律标注规则对语料库中的语音数据进行了音段特征和超音段特征的标注,基本完成了藏语拉萨话语音合成语料库的建立。  相似文献   

17.
介绍了语音识别技术ASR的发展历史、目前研究方法、技术手段及当前取得的成绩与不足,提出一种新的的研究理论——利用基因算法训练HMM方法.  相似文献   

18.
把语音信号转变为相应的文本或命令的高技术,让机器通过识别和理解语音、听懂人类的语言。  相似文献   

19.
用于语音识别(SR)的深度神经网络在提供强大的语言计算和分析能力的同时,极易受到对抗性攻击影响,在人为不可察觉的情况下,造成语音转录错误,甚至是执行特定非法控制命令.本研究聚焦语音识别对抗攻击,首先,从攻击模型的角度,以攻击演变的顺序对语音对抗攻击方法进行分类论述;然后,根据SR系统的输入方式、处理过程的特点,分析现有方法克服空中条件、优化攻击效果、添加不可察觉音频扰动的实现原理及相关的优势与劣势;最后,对语音识别所面临的技术挑战进行总结,并对未来研究发展方向进行展望.  相似文献   

20.
对基于ADSP2186的语音识别电话的硬件结构作了简明的介绍,并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号