首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 921 毫秒
1.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

2.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

3.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

4.
为提高语音端点检测在低信噪比情况下的准确性,提出一种基于近邻传播聚类的语音端点检测算法.首先采用能量语音端点检测去除静音段;然后利用近邻传播聚类自动获取类别数的优点,有效地将语音细分为无语义语音和静音段、远场噪声段等各种类别;最后结合后处理方法,对语音端点做进一步过滤处理.实验结果表明:该算法在低信噪比的情况下,与传统的能量语音端点检测相比,其有效语音检测的漏警率相对下降13%,虚警率相对下降14%;在实际应用中,如声纹确认和声音检测等,与经典算法相比,该算法检测的准确率与效率等性能得到了显著提升.  相似文献   

5.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

6.
通过藏文格助词的接续、结构以及上下文特征,提出基于规则、支持向量机、还原法等三层混合模式的藏文音节切分方法.藏文音节切分是藏文字频统计、分词、词性标注和机器翻译等研究领域的基础,其中藏文紧缩格歧义现象的正确识别、切分和还原是藏文音节切分的难点.经实验,混合模式藏文音节切分的F值为99.97%.  相似文献   

7.
针对固定门限方法在语音端点检测技术中的局限性,为了提高低信噪比下语音端点检测的鲁棒性和准确率,将自适应门限应用于分形维数的语音检测中,提出了一种新的语音端点检测算法.该算法通过对语音信号产生机制的分析,将分形维数用于语音起止点的检测中,设计了自适应门限,从而有效降低了噪声干扰对检测结果的影响,并实现了实时检测.仿真实验结果表明,在低信噪比的情况下,改进的端点检测算法比传统的短时能量检测算法可更准确有效地实现带噪语音的端点检测,而且对噪声干扰具有更好的鲁棒性.  相似文献   

8.
端点检测是语音信号处理的过程中非常重要的一个环节,其准确性直接影响语音信号处理的速度和结果.特别是在实际应用中因信噪比较低,使得某些高信噪比下性能好的端点检测算法准确率也比较低.为了提高在低信噪比的环境下佤语语音端点检测的准确率,本文使用了一种基于多窗谱估计谱减法和能熵比法的语音端点检测复合算法.该算法首先利用多窗谱估计谱减法去除语音的背景噪音以提高信噪比;其次再对去噪后的语音使用能熵比算法进行端点检测;最后借助Matlab工具对佤语语音进行仿真实验.仿真结果表明:对于低信噪比的环境下的佤语语音,本文使用的基于多窗谱估计谱减法和能熵比法复合算法同常规能熵比算法相比,端点检测的准确率提高了34%.  相似文献   

9.
一种改进型BIC话者改变检测算法   总被引:1,自引:0,他引:1  
该文针对多人说话改变点检测问题,提出一种新的改进型BIC话者改变检测算法.该算法基于BIC准则确定初选改变点,再对其端点的变化趋势做进一步分析,得出说话人改变的分割点.该算法准确率达到90.2%,召回率达到95.8%.与传统BIC检测算法相比,计算更简便,准确率与召回率分别提高了62.5%和16%.  相似文献   

10.
为提高低信噪比下语音端点检测的准确性,提出了一种基于模糊熵与改进相关向量机的端点检测算法.首先对语音信号进行基于听觉感知特性的语音增强,然后提取每帧信号的模糊熵作为改进相关向量机的输入矢量,同时针对单一核函数对预测分类鲁棒性弱的问题,对不同核函数进行自适应多核组合,融合多个核函数的特性,提高分类精度和鲁棒性.实验结果表明:在低信噪比环境下,基于模糊熵与改进相关向量机的端点检测能更有效地检测出语音的端点,准确率达到93.2%.  相似文献   

11.
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96.4%的切分正确率,比原算法提高5.2%.  相似文献   

12.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

13.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

14.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

15.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

16.
自适应多窗口梯度幅值边缘检测算法   总被引:1,自引:0,他引:1  
针对梯度幅值边缘检测算法无法检测连续边缘的问题,提出一种自适应多窗口梯度幅值边缘检测算法.首先使用传统梯度幅值边缘检测算法检测出初始边缘;然后在初始边缘上检测端点,使用K-均值聚类算法对端点进行分类,从而确定背景和目标灰度值接近的区域作为窗口;最后在窗口内使用梯度幅值检测边缘,通过多个窗口的并集得到最终的边缘.实验证明采用所提出的算法可以得到比较完整的边缘图,定位误差比传统的边缘检测算法小.  相似文献   

17.
传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

18.
传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

19.
根据语音的发声特点,基于分析语音信号中的基音频率和语音之间的关系,提出一种在强噪声环境下实现提高语音识别率的方法,并对基于基音频能值的端点检测算法和传统语音端点检测算法进行比较.实验结果表明该方法不仅能够有效提高语音段的检测率,同时还具有计算量小、实时性高、不受噪声影响即鲁棒性好等特点.  相似文献   

20.
提出了一种基于双权值神经网络的非特定人连续语音识别的新算法.这种算法可以不经过端点检测和分割,构建连续语音中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号