期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

余帅何培宇《四川大学学报(自然科学版)》2012,49(4):823-828

大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果. 相似文献

2.

一种基于 HMM 算法改进的语音识别系统

黄清方木云《重庆工商大学学报(自然科学版)》2022,39(5):56-61

针对传统的 HMM 模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的 HMM 模型。首先,令状态转移矩阵的对角线元素全为 0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算。最后,在 HMM 模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率输出值的比值大于 HMM 模型设定的初始值。与传统 HMM 模型实验比较,基于持续时间状态的 HMM 模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能。相似文献

3.

混响声场中语音识别方法研究 总被引：1，自引：4，他引：1

栗学丽徐柏龄《南京大学学报(自然科学版)》2003,39(4):525-531

免提式话筒语音识别系统是语音识别走向实用的目标之一．实现这一系统，首先要解决房间效应引起的混响问题．通过讨论室内混响声场中语音的特点，提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC，即MFCC参数在对数功率谱域进行低通滤波，倒谱域进行均值减，并用标准差加权进行非线性规整，采用这3种措施来消除混响引起的语音参数的变化．识别方法用矢量量化法，用4组无混响数码语音进行训练，对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98．7％．提出的这一新方法在不降低无混响音识别率的情况下，提高了混响声场的语音识别率．该方法不仅识别率高，而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统．相似文献

4.

基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法

《清华大学学报(自然科学版)》2017,(8)

语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错误率分别相对下降10.53%、5.17%和2.65%,展示了语音自适应聚类特征的良好性能。相似文献

5.

参数共享在语音识别中的应用

郭锐朱小燕《清华大学学报(自然科学版)》2002,42(10):1374-1376

参数共享是基于隐 Markov模型 (hidden Markovmodel,HMM)的语音识别系统的参数训练中的一个关键性问题 ,因此在语音识别的诸多领域中都有重要的应用。对参数共享的作用及其使用的聚类算法进行了分析研究 ,在此基础上提出改进合并分级聚类算法 ,并将其应用于 HMM的状态捆绑。实验表明 ,一个大规模词汇量的孤立词语音识别器采用 HMM的状态捆绑后 ,可以大大缩减识别过程的时空消耗 ,同时识别率仅有较小的损失相似文献

6.

基于镜像源方法抑制混响干扰的声全息算法改进

张宏宇郭文勇韩江桂陈汉涛夏菁《科学技术与工程》2019,19(33):113-118

针对实际厂房、机舱等封闭环境中,声全息成像受混响因素严重干扰的问题,在等效源近场声全息方法的基础上,采用房间脉冲响应代替自由空间格林函数建立传递函数,并利用压缩感知技术处理求解时的欠定问题,得到相对准确的等效源强度,以消除混响的干扰,提高声源定位的效果。通过初步的数值模拟,验证了方法的准确性和有效性。结果表明,与原算法相比,改进方法在混响环境中的声源定位具有明显的优势。相似文献

7.

基于分类识别的隐马尔可夫模型语音识别技术

魏明哲《山西师范大学学报：自然科学版》2014,(3):26-29

通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围. 相似文献

8.

一种基于维纳滤波去除语音通信中混响的方法

张德会陈光冶《上海交通大学学报》2009,43(6)

简要叙述了语音通信中去混响的意义.利用常规通话起始语音的习惯特点,提出了预存起始纯净语音信号,并基于维纳滤波原理,通过反卷积运算求出房间冲击响应,再通过反卷积去除语音信号混响的新方法.对语音样本的仿真试验表明,该方法对单字语音的去混响效果良好,在普通计算机上每字的去混响运算耗时为0.3～0.5 s. 相似文献

9.

汉语语音声学特征复合的研究

《云南大学学报(自然科学版)》2010,(Z1)

抽取短时声学特征参数如MFCC、PLP,使用高斯混合模型(GMM)估计特征参数对应音素的概率分布的隐马尔可夫模型(HMM)在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果.但短时特征却不能有效反应连续帧之间的相关特性,因此运用神经网络多层感知器(MLP)产生两类差异特征用于描述该帧的音素后验概率,并将其与传统特征复合为新的特征参数流,利用新特征流对GMHMM模型进行重构.对比实验结果表明,采用该混合声学特征的LVCSR系统其错字率(CER)有了3%～7%的改善. 相似文献

10.

基于深度学习的混响感知麦克风阵列语音增强

何伟刘雨佶童峰康元勋冯万健《厦门大学学报(自然科学版)》2024,(2):287-295+304

[目的]针对基于深度神经网络频谱估计的麦克风阵列算法存在数据依赖的问题,提出了一种基于深度学习的混响感知麦克风阵列语音增强算法.[方法]首先利用麦克风阵列波束形成输出与原始信号做互相关,以近似房间冲激响应的形式获取当前环境的混响特性作为LSTM网络的输入,网络模型以干净语音为目标进行训练从而输出房间冲激响应泛化向量,最后通过组合近似房间冲激响应与房间冲激响应泛化向量获得后置抗混响滤波器系数,实现语音增强.[结果]仿真和实验结果中,与波束形成、加权预测误差算法和传统深度学习去混响算法相比,所提出的方法在不同混响场景下具有更好的表现.[结论]本文方法在不同混响场景下都具有相对稳定的抗混响能力,具有较好的泛化性能. 相似文献

11.

HMM自适应法在应力变异语音识别系统的应用

张文祥张磊马银花《黑龙江科技学院学报》2007,17(5):368-372

为了使应力变异在顽健语音识别系统中能够达到较好的识别效果,研究了基于隐马尔可夫模型(HMM)的自适应技术,提出了将最大后验概率(MAP)和最大似然回归方法(MLLR)用于应力变异语音的自适应中.实验结果表明,与基本系统相比,两种方法均有效地提高系统识别率.以SD为初始模型的最大后验概率方法在150个训练样本时识别效果最好,可以达到90.4%. 相似文献

12.

有限态文法引导的基于连续密度HMM的连续汉语语音识别

林道发杨家沅《四川大学学报(自然科学版)》1993,30(2):184-188

介绍了用有限态文法引导的基于连续密度隐马尔可夫模型(HMM)的连续汉语语音识别系统.分析了系统的组成,词语的HMM的训练方法和对识别系统的测试结果。实验表明,用有限态文法辅助进行连续语音识别是一种有效的策略;连续密度HMM与基于矢量量化的HMM/VQ相比需要较大的计算量,但可明显提高识别准确率。相似文献

13.

一种高识别率的语音密码锁

林晓钢汪文林何渝郭永彩《重庆大学学报(自然科学版)》2008,31(3):307-310

采用基于统计模型的隐马尔可夫模型(hidden Markov model,HMM)来描述语音模型,进行语音模型库训练,并使用模板匹配的Viterbi算法进行语音识别,实现了以凌阳16位单片机SPCE061A为核心的语音密码锁系统,包括键盘模块、电源模块、门锁控制模块、LCD显示模块。该密码锁将语音密码和键盘密码技术相结合以保证系统安全性,通过测试,系统对特定人语音识别率为98%。相似文献

14.

一种改进的基于小波去噪HMM非特定人语音识别算法 总被引：1，自引：0，他引：1

李锦何培宇《四川大学学报(自然科学版)》2007,44(1):69-72

在HMM算法的基础上引入了小波去噪理论,从而提高了原始语音的信噪比和最终识别率.由于分别对每段语音去噪并进行端点检测,大大降低了运算量,因而减少了训练时间,达到了较好的识别效果.通过与DTW算法的对比,证明了改进的HMM算法在非特定人语音识别中的良好效果. 相似文献

15.

连续语音的三音子DDBHMM识别方法

游展肖熙王作英《清华大学学报(自然科学版)》2009,(4)

针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。相似文献

16.

一种新型语音识别系统 总被引：1，自引：0，他引：1

刘筠卢超《成都大学学报(自然科学版)》2008,27(3)

提出一种新型语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别.同时,提出了一种新的抗噪语音识别方法,通过改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好地抑制了噪声干扰,提高了语音识别率. 相似文献

17.

一种新型汉语单音节识别方法 总被引：1，自引：0，他引：1

曹洪《清华大学学报(自然科学版)》1990,(4)

介绍了一种新型字基ＶＱ／ＨＭＭ语音识别方法：ＶＱ与ＨＭＭ分级识别算法。使得ＶＱ部分可用作语音识别的第一级处理，ＨＭＭ部分作第二级识别。在第一级识别中可引进汉语的音素知识，使ＶＱ／ＨＭＭ性能进一步提高，并可用于大字汇表的实时语音识别，存贮量、计算量均大大减少。用此方法把汉语四声作一个ＨＭＭ模型，使汉语４００个基本音节的识别率达９６％以上．若加上精确四声识别则可识别汉语的１２００种声音。相似文献