首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可以使语音识别的解码过程更加紧凑有效.在对比实验中,传统的基于前缀合并的状态树搜索算法的大词表嵌入式单词拼读系统作为基线系统.实验结果表明,与基线系统相比,所提出的双层图搜索算法在系统解码速度相对提高10%的情况下,系统的动态内存占用仅为基线的8%.通过使用所提出的双层图搜索算法,大大提高了大词表嵌入式单词拼读系统的效率,使其更适用于大多数嵌入式平台.  相似文献   

2.
给出一种用于连续语音识别的词汇树搜索算法.这种方法基于启发搜索,分为音节层—树搜索、词层—树搜索两个过程.为在提高识别速度的同时不牺牲识别率,上述两个过程采用的是“有限宽度树搜索”.在音节层—树搜索中,根据Nbest算法确定允许扩展的有限个音节串.而在词层—树搜索中,根据已得到的允许扩展的音节串确定不同长度的“退回词路径”.这样,每一时刻的最大似然词串可由这些“退回词路径”来确定.这种算法的优点是在搜索不同长度的多音节词的同时,可以减少搜索计算开销和降低对存储空间的需求.  相似文献   

3.
维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。  相似文献   

4.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

5.
设计一款嵌入式语音识别系统,该系统硬件平台以凌阳公司的SPCE061A为核心。采用离散隐马尔科夫模型识别算法对非特定人的孤立词语音识别。实验结果表明,该系统对非特定人孤立词识别率达90%以上,性价比高,可应用于许多场合,有一定的市场前景。文章阐述了该系统各个电路模块及软件流程图的设计。  相似文献   

6.
Viterbi译码器是通信系统中应用非常广泛的译码器。与其他单载波调制技术相比,OFDM系统巾的Viterbi译码有其特别之处.可以根据在信道均衡时所得到的信道频域响应系数为译码算法提供判决权重,被称为CSI Viterbi译码算法。首先介绍了OFDM系统的CSI Viterbi译码器算法,然后以V—BLAST为例推导出MIMO-OFDM系统中的CSI Viterbi译码器算法,并通过仿真证明使用CSI Viterbi算法能有效改善系统的性能。  相似文献   

7.
本文介绍了隐式 Markov 模型(简称 HMM)识别语音的基本原理,对在训练孤立词模型过程中采用的 Baum-Welch 算法和 Viterbi 算法进行了研究,导出了参数估计的整套算式,提出了解决 HMM 在计算机上实现时出现的问题的方法及其实现算式。作者将 HMM 应用于汉语数字的识别,进行了不同算法的比较和不同初值条件的试验,给出了相应的识别结果。  相似文献   

8.
针对口语重复修正检错这一计算机辅助语言教学中的难点,提出一种基于音节单元WFST(weighted finite-state transducer)网络的容错对齐和搜索过滤算法。该算法将对齐后识别结果中邻近匹配词所对应的脚本建立上述语法网络进行二次识别下的容错对齐,得到的候选被修改部分和替换部分作为搜索过滤的查询和模板。最终,重复修正检错结果由搜索过滤算法的置信度决定。为此,提出了基于顺序假设的k-difference算法和基于随机假设的n-gram算法。实验表明:不使用二次容错对齐时,以音节为建模单元的多n-gram混合搜索过滤取得了相对最优的结果;使用二次容错对齐时,能够使F-measure获得3~4个百分比的进一步提升。  相似文献   

9.
语音识别中基于两层词法树的跨词搜索算法   总被引:1,自引:0,他引:1  
为了在连续语音识别过程中充分并且高效地使用上下文相关声学模型,提出了一种新颖的基于两层词法树的跨词搜索算法.采用两层词法树来表示搜索空间,解决了现有单层词法树的规模爆炸问题,使其有能力在词边界搜索中高效地使用上下文相关声学模型进行匹配,充分发挥上下文相关声学模型较好地描述协同发音现象的能力.实验结果表明,与词内搜索算法相比误识率平均下降60%,搜索时间达到实时,证明基于两层词法树的跨词搜索算法具有很好的识别性能.  相似文献   

10.
提出一种基于径向基函数神经网络的改进聚类方法,并将此改进的神经网络应用于语音识别领域,建立一个非特定人的孤立词语音识别系统.此聚类方法采取有监督的学习方式,将训练样本的形心作为隐节点的质心,训练样本的分类数作为隐节点的个数.利用该方法对小词表汉语孤立词进行语音识别.结果表明,采用此算法的径向基函数的神经网络具有更好的分类能力,训练速度和识别率均优于传统的径向基函数网络.  相似文献   

11.
针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要。两阶段分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图。检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值。  相似文献   

12.
矢量量化技术和隐马尔柯夫模型方法在韵母识别中的应用   总被引:2,自引:0,他引:2  
本文应用矢量量化技术(Vector Quantization)和隐马尔柯夫模型方法(Hidden Markov Model)为一个全字汇量的孤立字普通话语音识别系统设计了韵母识别子系统.该系统由韵母信号析取器、滤波器阵列特征分析器、矢量量化器、预识别器、隐马尔柯夫模型匹配器和决策器组成.根据对汉语中1172个不同音节的语音信号测试结果,决策器输出的准确率(即系统的最后识别准确率)为89.5%,而前两个估计的识别准确率则达到97.2%.系统的训练包括生成矢量量化器的码字和为每一个韵母建立隐马尔柯夫模型,改进了Linde 等人提出的码字生成算法,提出了一个得到隐马尔柯夫模型参数的系统化方法.  相似文献   

13.
本文探讨了一种特定人的汉语全音节语音识别方案,介绍了一种基于人耳听觉特性的语音参数的提取方法,对以1/3倍频程分布的16个通道滤波器组的对数能量输出用非线性时域归正方法归正到定长,然后求出相邻通道间频谱的变化量,即得到一组新的特征参数——频变参数.这组参数能够较好地反映语音中与感知有关的特性,如高音、音强、音调等.音节被选用来作为识别的基本单位,以400个汉语无调音节作为字表.最后给出了识别结果.  相似文献   

14.
利用段长信息的改进连续语音识别算法   总被引:1,自引:1,他引:1  
以基于段长分布的隐含Markov模型为基础,提出了一种改进的帧同步束搜索连续语音识别算法,使段长信息在连续语音识别中得到充分有效的利用,并与原算法作了比较。在该算法的具体实现上,建立了状态的局部路径组和全局活跃路径两种数据结构,并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验,实验结果表明,利用段长信息改进识别算法比原识别算法字的误识率降低了6%。  相似文献   

15.
一种新型汉语单音节识别方法   总被引:1,自引:0,他引:1  
介绍了一种新型字基 VQ/HMM语音识别方法: VQ与 HMM分级识别算法。 使得 VQ部分可用作语音识别的第一级处理, HMM部分作第二级识别。在第一级识别中 可引进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字汇表的实时语音识 别,存贮量、计算量均大大减少。用此方法把汉语四声作一个 HMM模型,使汉语 400 个基本音节的识别率达 96%以上.若加上精确四声识别则可识别汉语的 1200种声音。  相似文献   

16.
音节时长的研究是韵律模型和语音合成系统的基础,本文基于词汇层面,随机挑选了单音节词、双音节词、三音节词、四音节词(成语)各200个,录制了1男1女藏语拉萨话发音人的语音,提取有效时长。研究了男女发音人不同长度词汇的时长分布,并对不同长度词汇的音节平均时长进行比较。结果表明:1)男女声的词汇时长总体分布比较集中;2)随着词汇长度的增加,音节平均时长逐渐变小,减小幅度成递减趋势;3)整体上来看,女声时长要大于男声时长。  相似文献   

17.
现代藏文自动校对中,对音节字( )的校对是其基础。在藏文文本中音节字是用音节点进行间隔的,由于藏文二维的书写特征和音节字形成过程中与其构件之间严格的搭配规则等诸多问题,使得对它的校对又区别于任何一种文字。文章介绍了音节字的构件、结构和搭配规则等问题,列举了藏文音节字中的错误类型,并针对其特殊性给出了一个特有的音节字校对的流程和方法。  相似文献   

18.
利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人平台对系统进行测试,结果表明,系统识别效果良好,控制者通过语音可以实时控制机器人行动。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号