首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率  相似文献   

2.
利用计算机识别少数民族语音是保护和传承民族文化的重要手段。白族是祖国西南边陲重要的少数民族之一,其历史悠久,文化灿烂。为实现使用白族语进行人与计算机的语音交互,提出了一种基于HTK的白族语音词识别方法。该方法针对白族语的发音特点,以音素为基本识别单元,利用HTK工具提取39维MFCC语音特征参数,构建HMM模型,采用Viterbi算法进行模型训练和匹配来实现白族语音的识别。实验表明,算法的识别准确率达到93-3%。该方法识别准确率高,为研究少数民族语音识别提供了有益的借鉴。  相似文献   

3.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

4.
本文提出了一个基于估计共振峰走向的汉语韵母识别方案。实验中利用倒频谱的性质对语音的短时谱进行同态平滑处理,分析了复合韵母共振峰走向现象与语音学理论的一致性。根据频谱分析的结果建立了一个以共振峰走向为识别模型的韵母识别系统。对10位发音人的860个韵母(单韵母、双元音和三元音韵母)发音进行识别测验,平均识别率达到88.1%。本文为复韵母的不认人识别提供了一种合理的方法。  相似文献   

5.
对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。  相似文献   

6.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元.基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行.  相似文献   

7.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。  相似文献   

8.
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果.  相似文献   

9.
BP人工神经元网络与汉语语音的音节切分   总被引:1,自引:0,他引:1  
提出了一种基于BP人工神经元网络的汉语语音声韵母分割算法.计算机模拟结果表明,该算法只需对极少数典型音节进行简单训练,便可实现汉语语音的声韵母分割,且分割精度远大于传统算法所能获得的精度.  相似文献   

10.
一种新型汉语单音节识别方法   总被引:1,自引:0,他引:1  
介绍了一种新型字基 VQ/HMM语音识别方法: VQ与 HMM分级识别算法。 使得 VQ部分可用作语音识别的第一级处理, HMM部分作第二级识别。在第一级识别中 可引进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字汇表的实时语音识 别,存贮量、计算量均大大减少。用此方法把汉语四声作一个 HMM模型,使汉语 400 个基本音节的识别率达 96%以上.若加上精确四声识别则可识别汉语的 1200种声音。  相似文献   

11.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

12.
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。  相似文献   

13.
基于后验概率词格的汉语自然对话语音索引   总被引:1,自引:0,他引:1  
语音索引是语音检索任务的关键问题之一.该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法.采用后验概率形式表示的词格取代最优路径进行索引.根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%.根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LVSCR得到的)和66.9%(用音节识别器得到的)提高到78.8%.  相似文献   

14.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

15.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

16.
主要讨论了对于小词汇量孤立词的汉语语音识别问题。文中采用欧洲通信标准委员会(ETSI)发布的GSMEFR声码器对输入语音信号进行特征提取。在识别模块采用基于动态规划原理的动态时转弯析(DTW)技术对提取的测试语音参数与训练模板的语音参数进行匹配,得到的误差最小值即为识别结果。实验结果表明,对于20条语音命令,识别准确率达到96%以上,识别时间小于1.5s。  相似文献   

17.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:3,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

18.
基于径向基神经网络的数字"0"~"9"语音识别   总被引:1,自引:0,他引:1  
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上.  相似文献   

19.
设想一套汉语方言语音识别系统。该系统将具有声、韵、调自动识别,中古声母、韵母、声调以及声母开齐合撮检索,同音和有音无字词检索,轻声、连读变调识别和文白异读识别等5个功能,汉语方言识别系统的构建将提高汉语方言研究的工作效率。  相似文献   

20.
核心目标词识别是对一条待测句子,识别出句子中能够激起核心语义场景的目标词.文章把核心目标词识别任务分成基于规则过滤识别阶段和基于分类模型识别阶段.利用预先构建的词元表对待测句子中的词进行筛选,识别出候选目标词,使用基于分类模型的识别方法,构建分类特征模板,最终确定句子的核心目标词.文章在汉语框架网的标注语料集上进行测试,实验结果表明,相比于基于规则过滤识别阶段,基于分类模型识别阶段识别率有显著地提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号