首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 93 毫秒
1.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

2.
根据语音信号的“可视”特点,提出了一种基于简化脉冲耦合神经网络(PCNN)实现孤立词语音识别的方法。将语谱图输入到PCNN中得到相应的时间序列标识,作为语音信号的特征参数,然后通过模板匹配法和概率神经网络(PNN)相结合的方法实现语音分类识别。仿真结果表明,该方法能够达到较高的语音识别率。  相似文献   

3.
普米语是一种无文字的少数民族语言,目前已处于濒危状态,建立语音语料库及开展语音识别研究是保护和传承普米语的重要手段.基于HTK的语音识别中,参数的选取对不同语言的识别率有很大的影响.针对MFCC维数、HMM状态数及GMM个数这3个参数对普米语的识别率进行研究,结果表明:普米语语音识别的最佳MFCC维数为13维,最佳HMM状态数为8个,最佳GMM个数为3个.  相似文献   

4.
为提高识别率和识别效率,采用双门限过零率和短时能量作为端点检测的依据,提取Mel频率倒谱系数作为语音特征参数,并使用DTW算法进行模式匹配.由于传统DTW算法计算量大,所以采用局部路径约束和区域约束进行改进,并用Matlab对改进后的DTW算法进行了仿真.实验证明该算法对孤立词语音识别能够达到较好的识别结果.  相似文献   

5.
利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人平台对系统进行测试,结果表明,系统识别效果良好,控制者通过语音可以实时控制机器人行动。  相似文献   

6.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

7.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:1,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

8.
李志刚 《科技信息》2007,(23):40-40,105
计算机能听懂人类的语言吗?我们能扔掉键盘、鼠标用自然语言操纵计算机吗?人与计算机之间能够用自然语言进行通信和交流吗?随着语音识别技术的发展,这些梦想正在变为现实。  相似文献   

9.
特定人孤立词语音识别系统的仿真与分析   总被引:2,自引:1,他引:2  
在MATLAB环境下利用语音工具箱Voice Box,设计并实现了基于DTW算法的特定人的孤立词语音识别系统.论述了高效DTW算法的基本原理及系统的实现过程.仿真结果表明,该系统对特定人的孤立词取得了良好的识别率.  相似文献   

10.
端点检测是语音信号处理的过程中非常重要的一个环节,其准确性直接影响语音信号处理的速度和结果.特别是在实际应用中因信噪比较低,使得某些高信噪比下性能好的端点检测算法准确率也比较低.为了提高在低信噪比的环境下佤语语音端点检测的准确率,本文使用了一种基于多窗谱估计谱减法和能熵比法的语音端点检测复合算法.该算法首先利用多窗谱估计谱减法去除语音的背景噪音以提高信噪比;其次再对去噪后的语音使用能熵比算法进行端点检测;最后借助Matlab工具对佤语语音进行仿真实验.仿真结果表明:对于低信噪比的环境下的佤语语音,本文使用的基于多窗谱估计谱减法和能熵比法复合算法同常规能熵比算法相比,端点检测的准确率提高了34%.  相似文献   

11.
目前,高准确率的语音识别需要在大规模语料库上进行学习才能获得,然而大规模语料库的构建成本较高,某些语言很难采集到充足的语料,因此,基于小规模语料库的语音识别已成为目前挑战性的研究问题.元学习是模仿人类利用已有经验快速学习新知识的机器学习方法,在机器视觉单样本学习任务中表现出明显的优势,已成为新的机器学习研究热点.将元学习应用于单样本语音识别是解决基于小规模语料库语音识别这一挑战性问题的有效途径,在TIMIT和佤语数据库上,开展了基于Reptile元学习算法的单样本孤立词语音识别研究.实验结果表明,该算法能有效地提升模型收敛速度与泛化精度,从而提升了模型的学习能力,说明元学习方法有助于解决小规模语料语音识别这一挑战性问题.  相似文献   

12.
针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%.  相似文献   

13.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

14.
近年来,神经网络语言模型的研究越来越受到学术界的广泛关注.基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点.在电话交谈语音识别系统中,语料本身具有一定的上下文相关性,而传统的语言模型对历史信息记忆能力有限,无法充分学习语料的相关性.针对这一问题,基于LSTM-DNN语言模型在充分学习电话交谈语料相关性的基础上,将其应用于语音识别系统的重评估过程,并将这一方法与基于高元语言模型、前向神经网络(feed forward neural network,FFNN)以及递归神经网络(recurrent neural network,RNN)语言模型的重评估方法进行对比.实验结果表明,LSTM-DNN语言模型在重评估方法中具有最优性能,与一遍解码结果相比,在中文测试集上字错误率平均下降4.1%.  相似文献   

15.
相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号