首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

2.
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。  相似文献   

3.
基于矩阵线性插值的说话人自适应算法   总被引:1,自引:0,他引:1  
语音识别技术中说话人快速自适应技术受到普遍关注。最大似然模型插值 (maxim um likelihood model inter-polation,ML MI)算法是一种有效的快速自适应算法 ,它的主要缺点是需要存储大量的特定人模型。为克服这一缺点 ,该文提出一种改进方法——矩阵线性插值自适应算法。该算法用表示说话人特性的矩阵代替 ML MI中的特定人模型进行线性插值。而插值系数由测试者提供的语音数据按照最大似然准则确定。插值后的线性矩阵与非特定人模型相作用得到最终的说话人自适应模型。该算法大大减少了计算存储量 ,且自适应性能基本与 ML MI相当  相似文献   

4.
基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。  相似文献   

5.
连续语音识别中的说话人快速自适应技术   总被引:2,自引:0,他引:2  
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。  相似文献   

6.
缩减状态序列估计算法的实现研究   总被引:1,自引:0,他引:1  
基于信号子集分割原理和信道离散时间模的特点,分析了无记忆信号缩减状态机的状态转换规律,并提出一种通用实现方法,该方法具有实现简单,计算量小,存储量小的特点,了地解决了RSSE算法的实现问题。  相似文献   

7.
为解决最大似然DOA(Direction of Arrival)估计多维非线性搜索计算量大的问题, 将布谷鸟搜索算法与最大似然算法相结合, 利用布谷鸟搜索算法优化多维非线性的最大似然DOA估计谱函数。在保留布谷鸟搜索算法的主体思想的同时, 改进了算法的位置迭代方式, 加快了收敛速度。仿真结果表明, 改进的布谷鸟搜索算法在DOA估计中具有较好的收敛性, 估计性能较好。  相似文献   

8.
首先讨论了在开阔海洋环境中对目标的和参数估计问题。再提交了一种搜索宽带模糊函数峰值的高效算法。在噪声环境中,利用最大似然性对宽带模糊函数进行峰值能使算法的性能被进一步改进。由于最大似然时延估计器明最好的误差性能,从这种意义上来说,在同类的时延估计器中,它是一种最优的估计器。这已经被我们用仿真模拟所证实。基于以上两种方法,最后提出了一种高效和最优的目标参数估算算法。  相似文献   

9.
在TD-SCDMA(UMTS TDD LCR)系统中,数据的可靠检测在很大程度上依赖于准确的载波同步及符号同步.提出了一种新的频偏估计算法,利用TD-SCDMA训练序列的特殊结构,用码片合并的方式估计频偏.仿真结果表明,该算法复杂度低,运算量小,在频率选择性信道环境下,有良好的抗多径和多码道性能.  相似文献   

10.
通过距离函数求出待识别样本属于各类别的似然函数。对准识别和易识别错误的样本,通过新证据的引入,合成2批或多批证据下的似然函数,确定样本的类别,从而减少了非典型样本的误识率,提高了识别的正确率。  相似文献   

11.
在大词表孤立词语音识别中,Viterbi搜索是时间消耗的主要因素。为改善基线系统性能,根据汉语孤立词识别的特点,提出了一种基于音节切分的束搜索算法,在音节层和词条层进行剪枝。该算法不增加内存开销。实验结果表明:在词表规模为10 000时,该算法以0.23%的识别率下降率为代价,将Viterbi搜索的时间消耗降低为基线系统的26.73%;相对于小词表,该算法在大词表情况下对系统性能的改善尤为明显。  相似文献   

12.
语音识别中基于两层词法树的跨词搜索算法   总被引:1,自引:0,他引:1  
为了在连续语音识别过程中充分并且高效地使用上下文相关声学模型,提出了一种新颖的基于两层词法树的跨词搜索算法.采用两层词法树来表示搜索空间,解决了现有单层词法树的规模爆炸问题,使其有能力在词边界搜索中高效地使用上下文相关声学模型进行匹配,充分发挥上下文相关声学模型较好地描述协同发音现象的能力.实验结果表明,与词内搜索算法相比误识率平均下降60%,搜索时间达到实时,证明基于两层词法树的跨词搜索算法具有很好的识别性能.  相似文献   

13.
为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可以使语音识别的解码过程更加紧凑有效.在对比实验中,传统的基于前缀合并的状态树搜索算法的大词表嵌入式单词拼读系统作为基线系统.实验结果表明,与基线系统相比,所提出的双层图搜索算法在系统解码速度相对提高10%的情况下,系统的动态内存占用仅为基线的8%.通过使用所提出的双层图搜索算法,大大提高了大词表嵌入式单词拼读系统的效率,使其更适用于大多数嵌入式平台.  相似文献   

14.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。  相似文献   

15.
连续语音识别系统中测度计算的快速算法研究   总被引:3,自引:0,他引:3  
随着语音识别技术的迅速发展,其实用化前景已经逐步明朗起来,而语音识别系统实时化是首先必须解决的问题。由于测度计算占用了整个识别系统中绝大部分的计算量,所以降低测度计算的复杂度是系统实时化的首要问题。在对此加以分析的基础上,根据两级识别的思想,改进了基于决策树的方法,更进一步提出了基于Cholesky分解的M对角线方法,介绍了这些方法的原理和实现,并在大量实验的基础上对结果进行了比较和分析,说明了方法的实用效果。改进后的系统在识别率稍有下降的情况下使识别时间大为减少。  相似文献   

16.
为了使应力变异在顽健语音识别系统中能够达到较好的识别效果,研究了基于隐马尔可夫模型(HMM)的自适应技术,提出了将最大后验概率(MAP)和最大似然回归方法(MLLR)用于应力变异语音的自适应中.实验结果表明,与基本系统相比,两种方法均有效地提高系统识别率.以SD为初始模型的最大后验概率方法在150个训练样本时识别效果最好,可以达到90.4%.  相似文献   

17.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号