首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。  相似文献   

2.
为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。  相似文献   

3.
作为一种人机信息交互技术,语音识别技术得到了广泛的应用.介绍了基于凌阳十六位单片机SPCE061A的语音识别系统.并且采用了以传统的线性预测倒谱系数(LPCC)与分形维教相结合的混合参数作为特征参数的语音识别方法.LPCC方法是体现说话人特定的声道共振特性的线性预测方法,而分形维数则可以定量的描述语音气流中的非线性混沌特征.实验结果表明,基于LPCC与分形维数混合参数的语音识别方法要比单一的LPCC参数语音识别方法识别效果好.  相似文献   

4.
提出了一种基于Hough变换从肺音的STFT光谱图中检测喘鸣音的方法.这一方法先对采集的数字肺音数据的STFT谱图进行ROI区域的截取,再利用Canny算子进行图像边缘检测,最后基于Hough变换数据的分析来自动识别喘鸣音.临床分析的数据包括临床采集的肺音和国际上共享的肺音文件.Hough变换检测方法在60例喘鸣音的检测中达到了87%的准确率,70例正常呼吸音的识别率达到74%.  相似文献   

5.
利用计算机识别少数民族语音是保护和传承民族文化的重要手段。白族是祖国西南边陲重要的少数民族之一,其历史悠久,文化灿烂。为实现使用白族语进行人与计算机的语音交互,提出了一种基于HTK的白族语音词识别方法。该方法针对白族语的发音特点,以音素为基本识别单元,利用HTK工具提取39维MFCC语音特征参数,构建HMM模型,采用Viterbi算法进行模型训练和匹配来实现白族语音的识别。实验表明,算法的识别准确率达到93-3%。该方法识别准确率高,为研究少数民族语音识别提供了有益的借鉴。  相似文献   

6.
基于混沌神经网络的语音识别方法   总被引:4,自引:0,他引:4  
基于语音信号的时变特性,研究了神经网络语音识别的方法.把混沌特性引入到神经元,构造了一种新的多层混沌神经网络结构,同时推导了相应的学习算法.把这种混沌神经网络用于语音识别,并与常用的神经网络语音识别方法作了比较.实验结果表明,混沌神经网络方法的平均识别率要高于同等条件下常用神经网络方法的识别率.  相似文献   

7.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。  相似文献   

8.
噪声环境下语音识别方法研究   总被引:5,自引:0,他引:5  
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。  相似文献   

9.
一种抗噪声语音识别方法   总被引:2,自引:0,他引:2  
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。  相似文献   

10.
基于并行基因算法的语音识别方法   总被引:1,自引:0,他引:1  
提出一种基于并行基因算法的孤立字识别时间规正算法,该算法是在[3]的基础上提出,可解决动态时间规划(DTW)难以解决的一些问题:①使距离归一化因子M与实际路径相关;②以自然方式提供多条最佳规划路径;③语音端点检测正确性对识别率的影响得到一定程度的改善。建立了试验数据库,根据试验数据建立了模板距离遵循正态分布的算法性能分析模型。比较了并行基因算法,串行基因算法[3]和动态时间规划算法的性能。试验结果表明:基因算法比动态时间规划能得到更高的识别率,在单CPU情形下,虽然并行基因算法的性能比串行基因算法略微提高,但至少可节约三分之一的CPU时间  相似文献   

11.
一种改进的混合型语音识别方法   总被引:1,自引:1,他引:1  
提出了一种改进的HMM语音识别方法,其主要特点是引入了加权函数算法,以减少系统的误识率,实验结果表明,这种识别方法不仅能提高系统的识别率,而且所需训练样本少。  相似文献   

12.
提出一种结合SOFM失真的HMM语音识别方法,它直接将SOFM失真测度与左右型离散HMM相结合综合利用SOFM失真五HMM状态输出概率作为HMM的匹配失真测度。该方法既可以看作为基于VQ失真语音识别方法的推广,又可以看作为半连续HMM的一种特例。实验结果证明它具有良好的效果。  相似文献   

13.
语音情感识别是人机交互的重要方向,可广泛应用于人机交互和呼叫中心等领域,有很大应用价值。近年来,深度神经网络在识别情感方面取得了巨大成功,但现有方法对高层语音特征提取会丢失大量原始信息并且识别准确率不高,本文提出了一种新的语音情感识别方法,由卷积神经网络从原始信号中提取特征,并在其堆叠一个2层长短时记忆神经网络,最终识别准确率达到91.74%,本文方法显著优于基于EMO-DB数据集等其他方法。  相似文献   

14.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

15.
普通话是以北方话为基础方言的,地处华北的晋中市,其方音突出体现了“晋语”的某些特点,但又有晋中方音特有的语音现象。晋中方音与普通话语音辩正主要表现在声母,韵母,声调三个方面。  相似文献   

16.
普通话是以北方话为基础方言的 ,地处华北的晋中市 ,其方音突出体现了“晋语”的某些特点 ,但又有晋中方音特有的语音现象。晋中方音与普通话语音辨正主要表现在声母 ,韵母 ,声调三个方面。  相似文献   

17.
通过子带Wiener滤波结合PUM(Probabilistic Union Model)模型,实现在噪声环境下连续字语音识别的方法。该方法先通过对语音信号进行子带Wiener滤波预处理消除已知噪声,为PUM模型提供只有局部被噪声污染的语音信号,再利用PUM模型进行抗噪语音识别。试验表明在各种不同的噪声环境下,该新方法有更高的平均识别率。  相似文献   

18.
混响声场中语音识别方法研究   总被引:1,自引:4,他引:1  
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC,即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统.  相似文献   

19.
针对语音识别性能提高的问题,提出了一种基于多分类器融合的语音识别方法,该方法使用支持向量机(support vector machine,SVM),RBF神经网络与贝叶斯网络作为成员分类器,根据样本库中抽取的校验集计算各成员分类器的权值,以加权评分的投票策略进行决策融合.实验结果表明,通过多分类器融合的识别结果明显优于...  相似文献   

20.
结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的LDA+kernel-KNNFLC方法.首先针对先验样本特征造成的计算量庞大问题,采用重心准则学习样本距离,改进了核学习的K近邻方法;然后加入LDA对情感特征向量进行优化,在避免维度冗余的情况下,更好地保证了情感信息识别的稳定性.最后,通过对特征空间再学习,结合LDA的kernel-KNNFLC方法优化了情感特征向量的类间区分度,适合于语音情感识别.对包含120维全局统计特征的语音情感数据库进行仿真实验,对降维方案、情感分类器和维度参数进行了多组对比分析.结果表明,LDA+kernel-KNNFLC方法在同等条件下性能提升效果最显著.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号