期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘晶邵玉斌龙华李一民《云南大学学报(自然科学版)》2022,(2):254-261

为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.?在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone?Frequency?Cepstrum?Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过... 相似文献

2.

基于Mel频谱图和CNN的电网涉鸟故障鸟声识别

邱志斌卢祖文王海祥况燕军《华南理工大学学报(自然科学版)》2022,50(2):129-136

为了提高电网渉鸟故障防治的针对性，提出了一种基于Mel频谱图和卷积神经网络(CNN)的鸟声识别方法。建立常见渉鸟故障对应的40类代表性鸟种的鸣声样本集，对鸟鸣信号进行分帧、加窗与降噪等预处理，计算每帧信号在各个Mel滤波器中的能量，根据能量大小与颜色深浅的映射关系提取鸟鸣信号的Mel频谱图。以电网涉鸟故障相关鸟种的Mel频谱图作为输入，通过CNN反复执行卷积-池化过程提取Mel频谱图特征，并进行多次迭代训练调整网络内部参数，得到最优模型用于鸟种识别。算例结果表明，40类鸟种的识别准确率达96.1%,识别效果优于其他迁移学习模型。文中研究结果可为输电线路运维人员正确识别相关鸟种、开展渉鸟故障差异化防治提供参考。相似文献

3.

基于GFCC特征提取机器人仿生声呐SLAM算法研究

《阜阳师范学院学报(自然科学版)》2021,(3)

针对移动机器人在室内环境下的定位问题,本文采用基于GFCC((Gammatone Frequency Cepstrum Coefficient))特征提取BatSLAM模型,用指数压缩来模拟听觉系统的非线性特性,使用加海宁窗处理来减小回波信号所存在的边缘影响,使用离散余弦变换来对耳蜗图进行有损数据压缩,从而提高耳蜗图的抗干扰能力,使用升半正弦倒谱提升来提高耳蜗图的鲁棒性,通过GFCC特征提取可以有效提高室内定位的精度和准确性。实验表明,基于GFCC特征提取BatSLAM模型,通过提高耳蜗图的抗干扰性和鲁棒性,可以有效的较小定位误差,从而提高移动机器人的定位精度和准确性。相似文献

4.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

5.

基于多尺度梅尔倒谱系数的转辙机声信号状态识别方法

姜琦冯庆胜《科学技术与工程》2022,22(16):6680-6686

为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数（MFCC）;为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络（CNN）构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。本实验将S700K型转辙机在四种状态下运行时采集的真实声音信号进行训练和测试。实验结果表明,多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。相似文献

6.

噪声环境下多特征融合的语音端点检测方法

《云南大学学报(自然科学版)》2021,(4)

针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上. 相似文献

7.

基于特征融合方法的车型识别研究

赵宏旭《科学技术与工程》2018,18(18)

车辆音频信号具有复杂的特征,单一特征提取方法不能全面反应该特点。为了使提取的音频信号特征能更好地反映车辆原始信号,本文提出了将已有的短时能量(ENERGY)、短时傅里叶变换（STFT）及梅尔倒谱系数（MFCC）特征提取方法进行融合的方法,依据支持向量机（SVM）的分类识别算法,达到车辆识别的目的。实验表明,提出的组合方法优于单一提取方法,实现了提高识别率的目标,其中,ENERGY+MFCC组合方式效果最好。相似文献

8.

基于二阶差分MFCC深度学习的声景基调声分类方法

邓志勇张万亿刘爱利《中国传媒大学学报》2023,(5):26-35+54

本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。相似文献

9.

基于声信号的履带机器人地面分类试验研究

赵凯董明明刘锋王玉帅孙晋伟顾亮《北京理工大学学报》2018,38(9):912-916

为了拓展地面识别方式及提升识别率,提出利用履带机器人行驶噪声进行地面类型识别.使用声压传感器采集履带机器人在行驶过程中与地面相互作用辐射的声音信号,对声音信号提取修正的梅尔频率倒谱系数（MFCC）及其一阶差分（△MFCC）使用优化后的支持向量机（SVM）进行分类,并测试了该方法在多种背景噪声环境下的效果.结果表明,行驶噪声包含能够表征地面特点的信息.相比于幅域、频域和时频域特征,修正的MFCC+△MFCC特征具有明显优势.在校园环境中分类准确率达到了89.5%,当信噪比高于20 dB时,在多种背景噪声环境中分类准确率均达到80%左右. 相似文献

10.

基于听感知特征的语种识别 总被引：3，自引：0，他引：3

张卫强刘加《清华大学学报(自然科学版)》2009,(1)

为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反置等响度曲线模拟人耳对信号不同频率成分的主观响度感受。在基本听感知特征的基础上,还提出了一、二阶差分特征和偏移差分特征用于语种识别。对比实验表明,该文所提的听感知特征性能均优于目前普遍使用的Mel频率倒谱系数(MFCC)特征及其衍生特征。相似文献