首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

2.
在说话人识别系统中,传统梅尔倒频谱系数(MFCC)所提取特征不能够很好的反映说话人动态特征,尤其在噪声环境中,识别率较低,鲁棒性不足。针对以上问题,提出一种基于改进梅尔倒频谱系数(MFCC)的方法,通过多窗谱估计和一阶、二阶差分的方法提升识别性能。实验结果证明,在纯净语音和添加信噪的情况下,改进后方法的识别准确率都有所提升。当训练集为纯净语音,只为测试集添加噪声时,实验结果依然有较高的准确率。  相似文献   

3.
语音增强的目的是从带噪语音中提取尽可能纯净的原始语音.目前语音增强的方法很多,但由于噪声产生是随机的,而且产生的原因和特性相当复杂,因此在实际应用过程中要根据需求选用适当的语音增强技术才能达到较为理想的降噪效果.本文对不同噪声环境下的语音信号采用三种常用的语音增强技术进行降噪,并采用不同语音端点检测方法进行仿真实验来衡量降噪效果.  相似文献   

4.
为了进一步提高增强语音的质量,基于传统的贝叶斯非负矩阵分解语音增强算法,考虑语音帧内原子间的相关性,提出了一种新的改进贝叶斯非负矩阵分解语音增强算法。该算法可分为训练和增强2个阶段:训练阶段利用该算法分别对纯净语音和噪声进行训练,得到纯净语音和噪声字典;增强阶段利用训练得到的纯净语音和噪声字典组成的联合字典结合,计算带噪语音时变增益,并利用最小均方误差估计得到增强语音频谱,进而重构增强语音。实验结果表明,该算法的对数频谱距离值和主观语音质量评估打分均优于非负矩阵分解(NMF)和贝叶斯非负矩阵分解(BNMF)等传统的语音增强算法,特别是在低信噪比条件下,该算法增强的效果更佳。  相似文献   

5.
提出了一种基于小波包分析的滚动轴承故障诊断方法用于实现滚动轴承早期故障的检测.该方法的诊断过程如下:对轴承原始振动信号进行频谱分析,获取振动信号能量集中的频段.根据频段的范围和振动信号的采样频率确定小波包分解的层数.采用小波包分解的方法提取滚动轴承振动信号中能量集中的频段并生成相应的重构信号,对重构后的振动信号进行Hilbert变换和二次频谱分析.通过对比轴承故障的特征频率和二次频谱中的特征谱线判断轴承是否有故障及其发生位置.运用上述方法对具有外环故障的滚动轴承进行了实验研究并成功地实现了滚动轴承外环故障的检测.实验结果表明基于小波包分析的诊断方法可以有效诊断出滚动轴承的早期故障.  相似文献   

6.
针对语音/音乐分类过程中由于特征参数提取过多造成的维数灾难及分类准确率有待提高等问题,提出了一种基于过零率及频谱的语音/音乐分类算法.该算法在对语音及音乐2类信号进行端点检测及分段预处理后,结合每一音频段的过零率和频谱幅值特性进行分类识别处理,最后通过计算被判别为语音或音乐的概率实现分类.实验结果表明,此算法在音频分类中较同样最多只提2个音频特征且未用分类器算法的准确率平均提高约7.9%,较提取多个音频特征且采用分类器算法的准确率平均提高约5.7%.证明了该算法不仅计算量小,且分类准确率也有所提高.  相似文献   

7.
语音情感识别在人机交互中有重要的作用。在语音情感识别领域中,通常使用迁移学习解决语音情感数据难获取的问题,但忽略了语音数据的时序信息和空间信息。考虑到AlexNet网络中的参数来自图像数据集,不能完全表现语音数据的空间信息,并且不包含时序信息,因此提出通过膨胀卷积网络提取语音频谱图的空间信息,添加双向长短期记忆神经网络提取时序信息,并进行时空特征融合;针对语音中含有大量与情感无关的特征,通过将对数梅尔频谱图的三个通道作为输入,减少情感无关因素的影响,并添加注意力机制,选取情感权重大的时域信号。用公开数据集实验证明了方法的有效性,在WAR和UAR上都有提升。  相似文献   

8.
飞行模拟器是训练飞行员的必须装备,音效系统作为飞行模拟器的重要组成部分,直接影响飞行仿真的逼真度和沉浸感.声源采集作为音效系统开发的第一步,已成为整个开发过程中最繁琐的一环.基于这一背景,寻求在低成本录音情况下高效的声源提取方法.提出基于短时傅里叶变换声源提取方法,指出其优缺点并通过实例来提取声源.针对其缺点,提出频谱建模合成技术,简述该技术的实现步骤和基本理论,指出该技术虽然实现声源的真正分离,可以直接用来提取声源,但理论复杂且很多实现步骤需要复杂的信号处理算法.因此,依据处理对象飞机发动机声音是谐音与噪声这一事实,提出简化的频谱建模合成技术并使用该技术从飞机发动机起动原始录音中提取出发动机起动生成的谐音与噪声,证明该方法的可行性.提出的声源提取方法不仅适用于飞行模拟器,还适用于其他各种模拟器音效系统的开发,有很大的工程应用价值.  相似文献   

9.
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果.  相似文献   

10.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号