首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在案件侦破中方言的辨别能提供重要线索,为了对汉语方言进行辨别,基于长短期记忆神经网络LSTM的方言辨识模型被提出,语音样本数据其中包括地区口头禅均采集于贵州省6个地区,并提取梅尔频率倒谱系数MFCC,每份语音样本MFCC后面加上相应的地区口头禅MFCC,然后采用滑窗进行信息重叠分块,对每块分别进行横向与纵向奇异值分解并保留高贡献率的特征向量,把分块合并作为方言识别模型的输入数据。先对LSTM进行改进,然后构建方言识别模型,通过交叉实验对该模型进行训练和验证,从而对滑窗的宽度进行优化,同时与循环神经网络RNN进行比较。实验结果证明本研究构建的LSTM模型对汉语方言识别是高效的。  相似文献   

2.
语音情感识别是人机交互、情感计算中重要的研究方向.目前普遍使用深度神经网络用于语音情感特征的提取,但使用哪种神经网络模型、如何缓解模型过拟合问题还需进一步研究.针对这些问题,提出了一种结合一维卷积(CNN)以及门控循环单元(GRU)的CGRU模型,从原始语音信号的MFCC特征中提取语音的低阶以及高阶情感特征,并通过随机森林对其进行特征选择,在三种公用的情感语料库EMODB,SAVEE,RAVDESS上分别取得了79%,69%以及75%的识别精度.通过添加高斯噪声及改变速度等方法来增加样本量实现数据扩充,进一步提高了识别精度.通过在线识别系统验证了模型在实际环境中的可用性.  相似文献   

3.
用传统的梅尔倒谱系数作为特征进行车辆识别时,识别效果易受噪声干扰.为增强特征鲁棒性,提出一种加权的基频自适应梅尔倒谱系数特征提取算法.首先用能熵比法对车辆声音信号进行端点检测;然后提取车辆信号的基频,自适应构建三角滤波器组,提高滤波器对基频的感知敏感度;最后对基频自适应梅尔倒谱系数进行F比加权.实验结果表明,与传统梅尔倒谱系数相比,在识别车辆时,加权的基频自适应梅尔倒谱系数识别准确率提高7.10%,虚警率降低3.93%,漏警率降低7.10%.  相似文献   

4.
基于惯性传感器的步态识别研究是人工智能应用到实际生活的典型范例,近几年取得满意的成就.针对日常生活中连续动作类型的信号,对其进行精确分割和识别的效果仍略有不足;这些研究局限于传感器信号的时域特征和一些简单的频域特征,且没有对不同动静状态的动作进行分类.将人类常见6种连续行为分为3类动态动作和3类静态动作,并对其进行分割和识别.使用滤波器去除原始信号噪声干扰.通过滑动窗口分割法进行分割,对每一个窗口片段提取常用传统特征和梅尔倒谱系数,以及倒谱系数的一二阶delta导数等频域特征.将6类动作的不同特征进行多种组合,使用分类器识别不同动作,将不同特征组合的识别结果进行比较.该模型在UCI公开数据集随机抽取了5组测试样本,整体分割识别准确率最高达到98.19%.  相似文献   

5.
陈东  黄智鹏 《科学技术与工程》2021,21(11):4486-4491
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键.为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒...  相似文献   

6.
7.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

8.
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%.  相似文献   

9.
说话人识别中语音特征参数研究   总被引:1,自引:0,他引:1  
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。  相似文献   

10.
随着科学技术尤其是计算机技术的不断发展,语音识别被广泛应用到各个领域.针对方向指令的语音,使用梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)作为特征参数,连续马尔科夫模型(Continuous Hidden Markov Model,CHMM)作为识别模型,对语音信号进行识别处理.实验结果显示,此方法在方向指令语音识别中取得了良好的结果,有较高的识别准确率.  相似文献   

11.
基于模型匹配人脸识别的研究   总被引:1,自引:0,他引:1  
提出了基于模型匹配的人脸识别方法.利用人的脸部特征规律建立一个立体可调的模型框架,在定位出人的脸部位置后用模型框架定位和调整人的脸部特征部位,着重于解决人脸识别过程中的观察角度、遮挡和表情变化等因素影响.  相似文献   

12.
在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.  相似文献   

13.
在声音识别系统中,特征参数的获取对声音识别和训练有着重要的影响;MFCC算法作为典型的声音特征参数提取方法,性能稳定,识别率高;针对MFCC算法存在较大计算量的情况,提出一种改进的特征参数提取算法MFCC_E;相比于标准的MFCC算法,MFCC_E算法减少了约50%的运算量,并且易于硬件实现;实验结果表明,MFCC_E算法与MFCC算法的识别率大致相同,而计算复杂度却小很多。  相似文献   

14.
基于MFCCG-PCA的语音情感识别   总被引:1,自引:0,他引:1  
针对语音情感值维度大、难处理的问题, 结合MFCC改进算法和PCA模型, 进行二次优化, 提出一种新的语音情感值提取模型MFCCG-PCA。多组实验表明, 相比一般的MFCC模型, MFCCG-PCA模型在语音情感识别方面的性能有较大提高。  相似文献   

15.
以隐马尔可夫模型和动态纹理模型为代表的动态贝叶斯网是描述步态序列的重要方法,但都存在一些不足之处.提出了一种新的动态贝叶斯网——分层时序模型,该方法采用分段线性逼近非线性和用各段的动态纹理模型作为隐状态,将隐马尔可夫模型和动态纹理模型做了结合,充分发挥了其优势.该方法在CMU Mobo步态数据库和CASIA步态数据库B上做了评估,结果充分显示了分层时序模型的高性能.  相似文献   

16.
实现了一个基于双分界面的支持向量机的文本无关说话人识别系统,该系统在建立模型的过程中使用高斯混合模型进行特征提取,有效地减少了数据集的规模。与传统的支持向量机方法相比,该方法不仅达到了更高的识别率,对环境具有良好的鲁棒性,并且降低了算法的时间复杂度。由于该方法对大规模数据集的处理能力,使其比传统的方法更适合应用于实际。在相关实验中,也证实了该方法的有效性。  相似文献   

17.
赵忠彪  李文鑫  高荣 《河南科学》2008,26(7):839-841
介绍了语音识别的一般概念,利用MFCC对语音信号的特征信息进行了提取,在分析VQ模型和人工神经元网络的基础上,提出了一种VQ模型与神经元网络相结合的方法,并且建立了相关的数学模型.通过MATLAB仿真证明该模型具有很好的稳定性.  相似文献   

18.
城市边缘区小城镇发展模式研究--以长沙市为例   总被引:4,自引:0,他引:4  
随着城市建设步伐的加快,长沙市城市规模不断扩大,边缘区发展模式的选择举足轻重。根据长沙市边缘区各乡镇经济单元的区位、交通、经济基础、自然资源状况,提出卫星城镇模式、交通主导模式、园区开发模式、产业主导模式、旅游开发模式共5种主要发展模式,以及组团开发、区域推进的设想。  相似文献   

19.
基于一种听觉模型的特征提取及语音识别   总被引:4,自引:0,他引:4  
该文分析了人耳耳蜗及中枢听觉神经对声信号处理的机理,主要包括耳蜗对声信号的频率分析、柯蒂氏器官毛细胞的从振动机械能到电化学能的转换,听神侧抑制神经网络和增益调整四个层次,建立各个层次上听觉的数学模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号