期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李玲俐 /> 《重庆师范大学学报(自然科学版)》2016,(4):118-122

用于音乐和语音的识别方法不适用于非结构化环境声音事件的识别。提出一种基于隐马尔可夫模型（HMM）和支持向量机（SVM）的二层分类策略,对家庭保健监测系统中的语音、警报声、电话铃声、笑声、尖叫声和咳嗽声等6种声音事件进行识别。首先,提取Mel频率倒谱系数（MFCCs）来分析环境声音信号。其次,以提取的MFCC特征为输入,依次采用HMM和SVM构造二级分类模型,通过识别和确认两个过程来对家庭保健监测系统中的环境声音事件进行识别。实验证明,该技术能提高家庭保健监测系统中易混淆环境声音的识别率。
相似文献

2.

特定类型音频流泛化识别方法 总被引：2，自引：2，他引：0

罗森林李金玉潘丽敏《北京理工大学学报》2011,31(10):1231-1235

提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%. 相似文献

3.

基于HMM／SVM的音频自动分类

史东承韩玲艳于明会《吉林工学院学报》2008,29(2):178-182

提出一种基于隐马尔可夫模型和支持向量机混合模型的音频分类方法,用于语音、音乐、语音＋音乐、静音4类音频分类。首先利用4个HMM分类器对音频进行初步分类,确定最可能的两种音频分类结果,再用相应的SVM分类器做最终判决。实验结果表明,隐马尔可夫模型和支持向量机的两级分类器分类性能较好。相似文献

4.

Mel 频率下基于 LPC 的语音信号深度特征提取算法 总被引：1，自引：0，他引：1

罗元吴承军张毅黎小松席兵《重庆邮电大学学报(自然科学版)》2016,28(2):174-179

针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性. 相似文献

5.

基于HTK的白族语音识别方法

张令通《大理学院学报：综合版》2013,(10):27-32

利用计算机识别少数民族语音是保护和传承民族文化的重要手段。白族是祖国西南边陲重要的少数民族之一,其历史悠久,文化灿烂。为实现使用白族语进行人与计算机的语音交互,提出了一种基于HTK的白族语音词识别方法。该方法针对白族语的发音特点,以音素为基本识别单元,利用HTK工具提取39维MFCC语音特征参数,构建HMM模型,采用Viterbi算法进行模型训练和匹配来实现白族语音的识别。实验表明,算法的识别准确率达到93-3％。该方法识别准确率高,为研究少数民族语音识别提供了有益的借鉴。相似文献

6.

基于声信号的履带机器人地面分类试验研究

赵凯董明明刘锋王玉帅孙晋伟顾亮《北京理工大学学报》2018,38(9):912-916

为了拓展地面识别方式及提升识别率,提出利用履带机器人行驶噪声进行地面类型识别.使用声压传感器采集履带机器人在行驶过程中与地面相互作用辐射的声音信号,对声音信号提取修正的梅尔频率倒谱系数（MFCC）及其一阶差分（△MFCC）使用优化后的支持向量机（SVM）进行分类,并测试了该方法在多种背景噪声环境下的效果.结果表明,行驶噪声包含能够表征地面特点的信息.相比于幅域、频域和时频域特征,修正的MFCC+△MFCC特征具有明显优势.在校园环境中分类准确率达到了89.5%,当信噪比高于20 dB时,在多种背景噪声环境中分类准确率均达到80%左右. 相似文献

7.

融合GMM及SVM的特定音频事件高精度识别方法

罗森林王坤谢尔曼潘丽敏李金玉《北京理工大学学报》2014,34(7):716-722

针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型（GMM）及支持向量机（SVM）的特定音频事件识别算法. 该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板. 实验结果表明,识别准确率达到92.71%. 该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率. 相似文献

8.

一种基于MFCC与PCA的改进型语音识别算法

《南阳理工学院学报》2015,(6):56-60

Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。相似文献

9.

基于改进GFCC特征参数的广播音频语种识别

邵玉斌陈亮龙华杜庆治《吉林大学学报(理学版)》2022,60(2):417-424

针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法. 相似文献

10.

基于MFCC和GMM的个性音乐推荐模型 总被引：1，自引：1，他引：0

牛滨孔令志罗森林潘丽敏郭亮《北京理工大学学报》2009,29(4):351-355

提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%. 相似文献

11.

连续型隐马尔可夫模型(HMM)参数与语音识别 总被引：1，自引：0，他引：1

李四信韦岗《华中师范大学学报(自然科学版)》1998,32(1):43-47

提出了一种新的连续型隐马尔可夫模型（ＨＭＭ）的概率密度函数,并导出了一系列的参数寻优迭代公式,与常用的概率密度函数相比,它的运算量较小,且不易产生计算时的上溢与溢问题,把它用于ＨＭＭ语音识别,效果较好。相似文献

12.

基于向量空间模型的改进音频分类算法

康健辉吴渝郑继明《河南师范大学学报(自然科学版)》2008,36(6)

提出一种基于向量空间模型(VSM)的音频分类算法.特征提取中,针对目前采用的参数主要为静态特征,提出了基于信息论的动态特征计算方法,并根据其物理意义设置关键帧提取中的初始值,解决聚类局部极值问题.通过引入音频聚类的类内标准差,对传统VSM未处理特征项间相关信息的缺点进行改进,提出新的相似性度量方法,并以此方法对不同类别的音频构造分类器.实验结果证明,此方法提高了分类精度,准确度可达85%以上. 相似文献

13.

一种基于梯度的HMM参数重估方法

茅晓泉胡光锐《上海交通大学学报》2002,36(5):683-685

对于隐Markov模型（HMM），经典的参数重估方法是Eaum-Welch算法，该算法基于最大似然准则，具有快速收敛和保证似然度单调增的优点，但是对于其他的训练准则，则不存在这样的算法，由于目标函数的复杂性，在考虑采用梯度方法时，必须先解决如何求取梯度的问题，为此，提出一种求取梯度的实现方法，结果表明，使用该方法所取得的模型与用Baum-Welch算法所得的模型性能相当，而前者适用于基于各种准则的训练方法。相似文献

14.

有限词汇,特定人,商品化的英语语音识别系统

姚萝姑《上海交通大学学报》1996,30(6):141-146

介绍了一个在微机上实现的有限词，特定人语音识别系统，该系统采用连续，Ｍ元高斯混合密度的隐式马尔柯夫模型（ＣＤＨＭＭ）为识别方法，以修改后的ＢａｕｍＷｅｌｃｈ方法为训练重估算法，文中提出了对语音特征矢量非线性归一化预处理，和对训练数据不足的ＨＭＭ模型特征空产是进行后处理修正的算法，还提出了一种基于语音知识的模型初始化的方法，经实验证明，系统的识别率可以达到９０％以上。相似文献

15.

噪声环境中基于HMM模型的语音信号端点检测方法 总被引：8，自引：1，他引：8

朱杰韦晓东《上海交通大学学报》1998,32(10):14-16

在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别（ＡＳＲ）研究中的一个重要课题．常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想．讨论了一种基于ＨＭＭ模型的语音信号端点检测方法．先用训练的方法生成背景噪声和废料的模型,再用Ｖｉｔｅｒｂｉ解码算法对待测信号进行处理,并给出了具体的实现方法．实验测试结果表明,基于ＨＭＭ的端点检测方法的检测性能接近于人工检测,方法是有效的．相似文献

16.

基于GMM和二分类特征筛选的多级音频分类方法

高前勇戴蓓缮许东星《中国科学技术大学学报》2007,37(12):1466-1471

采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少. 相似文献

17.

基于遗传算法自适应建立HMM的静脉识别算法

薛定宇贾旭崔建江刘晶《东北大学学报(自然科学版)》2011,32(11):1529-1533

为了准确地对人的身份进行识别,利用图像中脉络延伸方向与脉络间位置的相互联系,将隐马尔科夫模型(HMM)应用于识别系统中,提出了一种基于遗传算法自适应建立HMM的静脉识别算法.图像经预处理后得到静脉的骨架信息,将细化后的静脉图像进行Radon变换,每一静脉对象可表示为一个HMM;对于已知确定的训练样本库,利用遗传算法自适应调整HMM参数,使所有测试图像的观测序列在真实匹配模型中发生的概率值远远大于其在虚假匹配模型中发生的概率值,提高了不同静脉对象的区分度.实验表明,该算法具有较高的正确识别率,并具有良好的实时性. 相似文献

18.

二阶隐Markov模型的一种简化算法及参数估计 总被引：1，自引：0，他引：1

杜世平《山西大学学报(自然科学版)》2009,32(3)

针对现有的二阶隐Markov模型(second-order HMM:HMM2)算法给出了一种新的简化算法.新算法是一种与Baum-Welch算法相似的算法,允许每一状态的观测概率密度函数(probability density function:PDF)可以用不同的特征集来定义和估计.基于此方法给出了相应的识别方法和参数估计.这种方法是基于充分统计量的,并且从理论上来说不会造成性能的损失. 相似文献