期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡旭琰邹月娴王文敏《清华大学学报(自然科学版)》2013,(6):753-756

针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。相似文献

2.

基于听感知特性的双麦克风近讲语音增强算法

蒋毅刘润生冯振明《清华大学学报(自然科学版)》2014,(9):1179-1183

针对近讲系统的声学场景,提出一种基于听感知特性的双麦克风语音增强算法。模拟人耳频率分解特性,用gammatone滤波器组对2路麦克风采集的声音信号进行多子带频率分解;对分解后的时域信号进行分帧,生成时频单元,并计算每个时频单元的能量;以2路信号时频单元能量比值为线索,估计每个时频单元信噪比,模拟人耳掩蔽特性生成掩蔽模板,并作用于带噪声的语音信号,实现目标语音与环境噪声的分离。实验结果表明:由2路麦克风信号时频单元能量的比值可较准确估计时频单元的信噪比;该算法可提高带babble噪声命令词的识别正确率,优于当前单通道及双通道语音增强算法。相似文献

3.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献

4.

Hilbert-Huang变换与大地电磁信号的时频分析 总被引：7，自引：0，他引：7

汤井田蔡剑华任政勇化希瑞《中南大学学报(自然科学版)》2009,40(5)

将Hilbert-Huang变换引入大地电磁信号的时频分析中,介绍HHT(Hilbert-Huang transform)时频分析原理及方法,给出仿真信号的经验模态分解及其时频分布,并对实测大地电磁信号进行HHT时频处理与剖析.研究结果表明:Hilbert能量谱随时频的具体分布具有很强的非稳态动态变换时频刻画能力;时频谱的时间、频率分辨率不受Heisenberg测不准原理的限制,且其时间、频率分辨率都很高,有很好的时频聚集性;HHT方法能用于描述大地电磁信号的非线性时变特征,是大地电磁信号时频分析的有效工具. 相似文献

5.

语音信号的小波变换处理方法 总被引：1，自引：0，他引：1

余伶俐《吉林工学院学报》2005,26(3):229-232

利用小波变换时-频分析的特点,针对语音信号特征,选取适当的小波母函数进行增强和压缩编码处理.通过Matlab仿真分析,得到增强后的信号图和压缩后的压缩比参数、能量保留参数、零系数比例系数.结果表明,基于小波变换的语音信号处理表现出良好的特性. 相似文献

6.

基于Teager能量算子和小波变换的语音识别特征参数 总被引：3，自引：0，他引：3

楼红伟胡光锐《上海交通大学学报》2003,37(Z1):83-85

基于Teager能量算子在抑制噪声和小波变换时多分辨特性,用Teager能量算子结合二进小波变换得到一种新的语音识别系统中的前端输出特征参数.该参数的一部分来源于Teager能量算子与传统的倒谱分析相结合产生的参数TEOCEP;另一部分基于小波而得到的小波能量矢量参数DWE,最后提出了TEOCEP-DWE特征参数.对新的语音特征参数进行实验分析表明,本算法能提高语音识别的性能. 相似文献

7.

浴室噪声环境下小词汇量语音识别系统研究

童强黄剑王永骥《华中科技大学学报(自然科学版)》2011,39(Z2):309-311

根据实际应用的需求,设计了一种在浴室噪声环境中的小词汇量的语音识别系统.针对特定的浴室噪声进行分析,引入一种语音增强算法来降低噪声对识别的影响.使用基于人耳听力模型的mel频率倒谱特征参数作为语音特征参数,并结合其一阶差分参数描述语音信号特征的动态特性.针对小词汇量的实际应用需求,选用基于动态时间规整的模板匹配方法来识别.该方法可以用于其他相似的噪声环境中,通过实验验证了该方法的可行性. 相似文献

8.

基于时/频ICA的PMC模型卷积噪声估计方法研究

吕钊张贝贝张超《安徽大学学报(自然科学版)》2016,40(5):24-31

为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能. 相似文献

9.

基于连续小波互谱的宽带Chirp信号DOA估计

王东辉庞伟正刘成德《应用科技》2007,34(4):13-15

提出一种时频域宽带源波达方向（DOA）估计算法．该算法通过计算参考阵元和其他阵元的连续小波互谱，构造出一种新的时频域数据向量模型，并利用Chirp信号的局部窄带特性，在信号的主要能量聚集区选择时频点构造时频相关矩阵代替传统的阵列相关矩阵，进行特征分解实现信号的DOA估计．该方法同时在空域和时频域进行处理，充分利用了时频分布的能量聚集性，实现了非平稳信号时频域的分离，仿真结果验证了新方法的有效性．相似文献

10.

基于非线性共振的说话人特征提取研究与仿真 总被引：1，自引：1，他引：0

何朝霞潘平《科学技术与工程》2012,12(25):6507-6510

针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。相似文献

11.

噪声环境中基于HMM模型的语音信号端点检测方法 总被引：7，自引：1，他引：6

朱杰韦晓东《上海交通大学学报》1998,32(10):14-16

在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别（ＡＳＲ）研究中的一个重要课题．常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想．讨论了一种基于ＨＭＭ模型的语音信号端点检测方法．先用训练的方法生成背景噪声和废料的模型,再用Ｖｉｔｅｒｂｉ解码算法对待测信号进行处理,并给出了具体的实现方法．实验测试结果表明,基于ＨＭＭ的端点检测方法的检测性能接近于人工检测,方法是有效的．相似文献

12.

时频分析在语音信号处理中的应用

许丽群马驰王睿杰《科学技术与工程》2011,11(21):5043-5046,5052

时频分析技术是近年来信号处理等领域一个新的研究热点。首先介绍了时频分析技术中的Winger-Ville分布和重排理论两种方法。然后应用这两种方法对去噪的语音信号进行时频分析处理。通过仿真结果表明,将重排理论应用于语音信号处理,能明显改进时频表示的可读性,更有效地识别信号和提取信息。相似文献

13.

小波变换在语音信号处理上的应用

唐玲程建《四川理工学院学报(自然科学版)》2012,(1):67-70

利用小波的多分辨率分析,以及其良好的空间域和频率域局部化特点,针对语音信号特征,选取适当的小波算法进行去噪和增强语音,压缩编码,提取语音信号特征等处理。通过Matlab仿真分析,得到增强后的信号图和压缩后的压缩比参数、能量保留参数、零系数比例系数,提取的信号特征。结果表明,基于小波变换的语音信号处理表现出良好的特性。相似文献

14.

基于小波变换的语音数据压缩的研究

张玺君王继曾蔺莹《科学技术与工程》2009,9(2)

语音数据压缩是为了提高信号传输和存储的效率.根据小波包变换时-频分析的特点,选取适当的小波函数将语音信号在正交小波包基下展开.由于语音信号的大部分能量集中在低频系数上,故对高频系数采用阈值量化处理,对剩余系数进行哈夫曼编码,从而完成语音数据的压缩.通过仿真分析,采用这种方法的压缩效果比较高. 相似文献

15.

Nonlinear Time-Frequency Distributions of Spectrum Energy Operator in Large Vocabulary Mandarin Speaker Independent Speech Recognition System

王作英《清华大学学报》2003,8(6):667-671

This work demonstrates the use of the nonlinear time-frequency distribution (NL TFD) of a discrete time energy operator (DTEO) based on amplitude modulation-frequency modulation demodulation techniques as a feature in speech recognition. The duration distribution based hidden Markov module in a speaker independent large vocabulary mandarin speech recognition system was reconstructed from the feature vectors in the front-end detection stage. The goal was to improve the performance of the existing system by combining new features to the baseline feature vector. This paper also deals with errors associated with using a pre-emphasis filter in the front end processing of the present scheme, which causes an increase in the noise energy at high frequencies above 4 kHz and in some cases degrades the recognition accuracy. The experimental results show that eliminating the pre-emphasis filters from the pre-processlng stage and using NL TFD with compensated DTEO combined with Mel frequency cepstrum components give a 21.95% reduction in the relative error rate compared to the conventional technique with 25 candidates used in the test. 相似文献

16.

基于短时和长时特征的语音情感识别研究

林奕琳韦岗《科学技术与工程》2006,6(4):450-454

基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。相似文献

17.

一种基于噪声模型的语音/噪声分类方法

吴边任晓林刘重庆张亚昕《上海交通大学学报》2004,38(9):1528-1531

提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法，该方法利用一个噪声模型，对每帧信号的评价值进行语音/噪声分类．实验表明，该方法可以有效地区分语音和噪声，并表现出在各种噪声环境和不同信噪比条件下的鲁棒性．该算法已经集成进一个ASR系统，并在Corn-paq iPAQ上进行了测试，其计算代价不到整个系统代价的10％．相似文献

18.

应用倒谱特征的带噪语音端点检测方法 总被引：7，自引：0，他引：7

韦晓东胡光锐任晓林《上海交通大学学报》2000,34(2):185-188

传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声－白噪声干扰情况和一种特殊噪声－汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适相似文献

19.

Adaptive Compensation Algorithm in Open Vocabulary Mandarin Speaker-Independent Speech Recognition

Fadhil H.T.Al-dulaimy 王作英田野《清华大学学报》2002,7(5)

IntroductionA speech signal is normally mixed with many kindsof noises,which can significantly decrease theperformance of a speech recognizer.The highconcentration of energy in the low frequency rangeobserved for most speech spectra is considered anuisance because it makes less relevant the energyof the signal at middle and high frequencies[1] .　The performance of automatic continuous speechrecognition (ACSR ) systems dramaticallydecreases when they are trained and used indifferent environm… 相似文献

20.

基于谱减的语音增强算法的改进

李晔崔慧娟唐昆《清华大学学报(自然科学版)》2006,46(10):1685-1687

为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。相似文献