期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

沈希忠郑晓修《上海应用技术学院学报：自然科学版》2018,18(3):273-277

语音端点检测是语音识别预处理的一个重要环节,语音端点判断正确与否直接影响到语音识别的效果。短时能量法与过零率方法是语音端点检测的两类主要方法,融合这两类算法,并结合短时频谱峰值,归纳总结了4条语音端点检测的融合检测准则。在语音分段时提出自适应逐级分段计算,寻找满足误差要求的语音起始和终止端点。语音实验验证了本文所提语音自适应分段融合检测方法的有效性,同时,该方法没有增加语音端点检测的额外计算量。相似文献

2.

文本文件的语音识别中音节的自动切分

张晓东崔仁涛《皖西学院学报》2004,20(2):18-20

汉语语音识别中对孤立词、小词汇特定人的语音识别率较高，但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节，可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征，找到了短时平均幅度和短时平均过零率的方法来检测音节的端点，从而得到对文本文件中汉语语音的音节自动切分算法。相似文献

3.

基于DSP实现语音端点检测 总被引：1，自引：0，他引：1

果永振何遵文刘畅毕志明《华北科技学院学报》2003,5(1):46-49

介绍了一种以DSP芯片为核心的语音端点检测模块，用于有线／无线自动转接设备。该模块的语音端点检测算法应用短时能量、短时过零率和短时自相关语音特征参量进行联合检测，达到了比较满意的端点检测效果。该模块应用于系统中能够实现通话方语音对通话过程的自动控制。相似文献

4.

基于短时相关性和极值点的语音边界检测

王道成胡修林张蕴玉《华中理工大学学报》2000,28(12):13-15

针对基于短时能量和过零率相结合的语音边界检测法在实际应用中的不足，提出了一种改进方法——基于短时相关性和极值点的语音边界检测法，并在MATLAB环境下进行实验测试，在语音客观评价及语音识别算法中取得了良好的效果．相似文献

5.

基于短时相关性和极值点的语音边界检测

王道成胡修林张蕴玉《华中科技大学学报(自然科学版)》2000,28(12):13-15

针对基于短时能量和过零率相结合的语音边界检测法在实际应用中的不足,提出了一种改进方法——基于短时相关性和极值点的语音边界检测法,并在MATLAB环境下进行实验测试,在语音客观评价及语音识别算法中取得了良好的效果．相似文献

6.

一种改进的基于短时平均幅度的语音端点检测算法研究

柳春《西北民族学院学报》2009,30(1):56-59

在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能. 相似文献

7.

可变时长的短时广播语音多语种识别

王瑶龙华邵玉斌杜庆治《云南大学学报(自然科学版)》2022,(3):490-496

针对短时语音时长过短以及训练语音和测试语音时长不等,导致语种识别性能大幅度下降的问题,提出了一种可变时长的短时广播语音多语种识别模型（Variable Duration-Language Identification, VD-LID）.首先,对不同时长的语音进行时长规整;然后,对规整后的短时语音进行特征提取,提取其对数功率谱包络图作为语种特征;最后,将语种特征输入到残差神经网络中进行分类.实验结果表明,相比于传统特征输入,对数功率谱包络图特征将短时语音的语种识别准确率提高到了82.4%;相比于没有引入时长规整层的语种识别模型,VD-LID在测试语音时长为5 s和10 s的实验中,语种识别准确率分别提升了27.9%和37.7%. 相似文献

8.

直升机声信号的特征分析

衡丽熊淑华《西南科技大学学报》2010,25(1):56-59

根据传统语音信号的分析方法分析了直升机声信号,采用MATLAB软件进行了仿真,提取出了两种直升机声信号的短时自相关函数、短时频谱图和线性预测系数LPC,并分析对比了两种不同型号直升机声信号的特征。实验结果表明短时自相关、短时频谱和LPC等特征参数能较好地分析与识别不同类型的直升机声信号。相似文献

9.

CELP短时预测器算法的研究

张海燕潘苏酆广增《南京邮电大学学报(自然科学版)》1995,(2)

码激励线性预测（ＣＥＬＰ）能够在低比特率情况下实现较高质量的语音．在ＣＥＬＰ编码方案的实现中，确定短时预测器和长时预测器的系数是至关重要的．在简单介绍了ＣＥＬＰ的基本原理和激励码本的产生方法后，着重研究短时预测器的算法．采用Ｂｕｒｇ法实现短时预测器，并正对其参数量化编码．计算机模拟表明，采用上述方法可得到较好的合成语音质量．相似文献

10.

一种基于短时能量和高阶差分的端点检测方法

肖军袁剑锋栾江峰黄卢记《北京师范大学学报(自然科学版)》2012,48(2):146-148

语音信号处理的速度和结果很大程度上受到端点检测的影响.传统的短时能量和过零率相结合的端点检测算法在低噪声环境下,可以获得满意的检测效果.然而,在高噪声的环境下,甚至难以有效检测语音信号.研究表明,高阶差分结合短时能量的新方法在低噪声环境下,可获得与传统方法相似的效果,而在高噪声下,则明显优于传统方法. 相似文献

11.

加性噪声环境下语音特征参数提取方法的研究

张昊慧《淮阴师范学院学报(自然科学版)》2010,9(4)

提出一种具有良好抗噪性的语音特征分析方法.将语音信号的短时自相关序列进行时间方向上的平滑处理,然后利用平滑后的序列代替原语音信号进行线性预测分析,从而得到线性预测倒谱系数.实验表明,利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数. 相似文献

12.

含噪语音信号中噪声参数的一种估计方法 总被引：2，自引：1，他引：1

陈砚圃戴启军卞正中《西安交通大学学报》2001,35(10):1096-1098,1100

为了提高含噪语音信号中噪声参数估计的实时性,利用语音信号的短时平稳性,提出了一种无需对含噪语音信号进行有声／无声检测的噪声参数估计法。仿真实验表明,该方法计算效率高、噪声参数估计的实时性,即使是噪声特性随时间缓慢变化也可得到良好的估计结果,可以方便地溶入到基于短时谱幅度估计的语音增强处理中。相似文献

13.

基于噪声短时谱动态估计的语音增强谱减算法

李银国薛雯徐洋《重庆邮电大学学报(自然科学版)》2010,22(2):127-130

针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果. 相似文献

14.

基于短时和长时特征的语音情感识别研究

林奕琳韦岗《科学技术与工程》2006,6(4):450-454

基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。相似文献

15.

基于噪声短时谱动态估计的语音增强谱减算法

李银国薛雯徐洋《重庆邮电学院学报(自然科学版)》2010,(2)

针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。相似文献

16.

基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测

柏顺颜夕宏张生平陈建飞张胜《南京师大学报(自然科学版)》2021,44(2):117-120

低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利... 相似文献

17.

基于短时对数谱的MMSE语音增强算法研究

陈红梅陈健《重庆邮电大学学报(自然科学版)》2004,16(3):65-68

研究了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE-LSA)估计的语音增强算法,给出了其算法分析的基本流程图.由于语音是时变的,因此,假设语音频谱分布为高斯分布,在此基础上讨论了MMSE-LSA算法的先验信噪比ξk的2种估计方法--最大似然估计方法和直接判决估计方法.试验证明此方法的语音增强效果较好,尤其在较低信噪比时效果更明显. 相似文献

18.

基于短时对数谱的MMSE语音增强算法研究

陈红梅陈健《重庆邮电学院学报(自然科学版)》2004,16(3):65-68

研究了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE—LSA)估计的语音增强算法，给出了其算法分析的基本流程图。由于语音是时变的，因此，假设语音频谱分布为高斯分布，在此基础上讨论了MMSE—LSA算法的先验信噪比ξh的2种估计方法——最大似然估计方法和直接判决估计方法。试验证明此方法的语音增强效果较好，尤其在较低信噪比时效果更明显。相似文献

19.

图形用户界面下敏感语音提取的仿真实现

张学敏王秀艳张建红《长春工程学院学报(自然科学版)》2011,12(2):109-112

获取纯净语音的不同频段音效时,常存在提取方法复杂、数据修改麻烦及效果不直观的缺点.鉴于此,利用短时傅里叶变换获取纯净语音在频域的频谱特性并分析其频谱分布特点,采用不同类型的FIR数字滤波器对纯净语音的感兴趣区进行敏感语音的提取,从而产生低音、中音和高音音效,并通过MATLAB图形用户界面实现之.仿真结果表明:在不同频段... 相似文献

20.

时频结合的带噪语音端点检测方法

李明《科技资讯》2011,(10):26-27

提出了一种时频结合的带噪语音端点检测方法。选取时域短时能量和频域熵构成一个新的特征,采用自适应门限进行端点检测。实验结果表明该方法在低信噪比环境下较传统方法提高了端点检测的准确率,鲁棒性较好。相似文献