首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 765 毫秒
1.
作为一种人机信息交互技术,语音识别技术得到了广泛的应用.介绍了基于凌阳十六位单片机SPCE061A的语音识别系统.并且采用了以传统的线性预测倒谱系数(LPCC)与分形维教相结合的混合参数作为特征参数的语音识别方法.LPCC方法是体现说话人特定的声道共振特性的线性预测方法,而分形维数则可以定量的描述语音气流中的非线性混沌特征.实验结果表明,基于LPCC与分形维数混合参数的语音识别方法要比单一的LPCC参数语音识别方法识别效果好.  相似文献   

2.
王蕾  孟慧杰 《科技信息》2010,(33):48-49
说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语音信号的特征提取。应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括LPCC、MEL倒谱系数、线性预测倒谱系数等,对这些参数进行分析和比较,以达到话者识别的目的。  相似文献   

3.
针对现有的说话人识别方法对环境噪声较为敏感的问题,提出了一种与文本无关的单训练样本说话人识别方法。该方法能够提取语音时频谱的局部特征,此特征不仅对白噪声、高斯噪声、粉红噪声有很强的鲁棒性,而且能够充分反映说话人的基本发声特性。针对该局部特征的基本特点,给出了适合该局部特征的贝叶斯决策方法。对英文与汉语语音数据库的仿真实验表明,该识别方法可以实现单训练样本下的说话人识别,识别精度明显高于现有的Mel频率倒谱系数(MFCC)与线性预测编码(LPCC)语音特征,而且对白噪声等各类环境噪声有较高的鲁棒性。  相似文献   

4.
语音信号非线性特征的研究   总被引:4,自引:0,他引:4       下载免费PDF全文
随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Lyapunov指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计  相似文献   

5.
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率.  相似文献   

6.
基于分形的配电网接地故障分支识别方法   总被引:1,自引:0,他引:1  
为解决当前配电网接地故障分支定位中算法实现困难,硬件实现成本投入太高的问题,在PSCAD/EM TDC仿真数据的基础上,对配电网接地位置改变与测量端信号变化的关系进行了分析与对比,提出了一种新的分支识别方法。在构造配电网系统传递函数的基础上,获得其分形维数和自相似度,通过分析不同接地故障情况下分形维数及自相似度变化的规律,提出了基于分形维数与自相似度的分支分析方法。通过对不同的接地位置及不同接地电阻的故障的分形维数及自相似度的分析对比,利用其X-Y平面图能够对故障分支进行识别。仿真结果表明,基于分形维数和自相似度的分支识别方法是有效的,而且具有很好的抗干扰性。  相似文献   

7.
为解决当前配电网接地故障分支定位中算法实现困难,硬件实现成本投入太高的问题,在PSCAD/EMTDC仿真数据的基础上,对配电网接地位置改变与测量端信号变化的关系进行了分析与对比,提出了一种新的分支识别方法。在构造配电网系统传递函数的基础上,获得其分形维数和自相似度,通过分析不同接地故障情况下分形维数及自相似度变化的规律,提出了基于分形维数与自相似度的分支分析方法。通过对不同的接地位置及不同接地电阻的故障的分形维数及自相似度的分析对比,利用其X-Y平面图能够对故障分支进行识别。仿真结果表明基于分形维数和自相似度的分支识别方法是有效的,而且具有很好的抗干扰性。  相似文献   

8.
现有的岩石力学参数获取方法依赖于钻井取心和测井资料,具有较大的时效限制。将分形几何理论应用于岩石力学参数实时预测的研究中。首先,利用完钻井深层岩心开展力学测试,建立岩石力学参数与多项测井物理量多元统计学模型。然后,开展上返岩屑颗粒的分形维数测试,并依据测井岩石力学模型计算出岩屑原位地层的岩石力学参数,将这些力学参数与岩屑分形维数建立统计学关系式。以准噶尔盆地玛湖凹陷Ma123井为例,通过测试上返岩屑的分形维数,进而实时计算出岩石的力学参数。完钻测井后基于测井反演模型绘制出该井岩石力学参数剖面。两种方法对比认为,基于岩屑分形维数计算的岩石力学参数具有较高的精度(误差小于10.9%)。同时,通过实践总结出一套基于录井岩屑分形理论的岩石力学参数的实时预测方法。该研究成果拓展了分形岩石力学的应用领域,为岩石力学参数的实时预测提供了新思路。  相似文献   

9.
管制指令特征参数提取研究   总被引:2,自引:1,他引:1  
在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。  相似文献   

10.
提出了一种基于复杂性测度的干扰样式识别方法.该方法首先分析接收信号的分形维数和LZ复杂度.通过使用一定数量样本,获得每种干扰样式分形维数和Lz复杂度分布的均值中心和方差.然后采用指数距离计算待识别样本与每种干扰的均值中心和方差的距离,按最小距离原则来对干扰样式进行识别.最后给出了仿真结果及结论.  相似文献   

11.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

12.
阐述了分析非线性、非平稳信号的Hilbert—Huang变换(HHT)算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。  相似文献   

13.
基于G.729编码参数的语音特征及其应用   总被引:1,自引:1,他引:1  
目的从低比特率语音编码参数中直接提取语音特征。方法针对G.729编码技术提出了一种从编码参数直接计算倒谱系数和基音/能量轨迹特征的方法。结果该方法通过对残差信号进行线性预测分析,提高了谱包络的精确程度,并从码本增益和延时参数中得到了基音/能量轨迹特征。结论说话人识别的实验结果显示,新方案能够使得基于G.729编码参数的说话人识别效果得到较明显的提高,达到了用解码语音进行识别的水平。  相似文献   

14.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

15.
王彪 《科学技术与工程》2012,12(10):2462-2464
为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

16.
本文探讨了一种特定人的汉语全音节语音识别方案,介绍了一种基于人耳听觉特性的语音参数的提取方法,对以1/3倍频程分布的16个通道滤波器组的对数能量输出用非线性时域归正方法归正到定长,然后求出相邻通道间频谱的变化量,即得到一组新的特征参数——频变参数.这组参数能够较好地反映语音中与感知有关的特性,如高音、音强、音调等.音节被选用来作为识别的基本单位,以400个汉语无调音节作为字表.最后给出了识别结果.  相似文献   

17.
说话人识别中语音特征参数研究   总被引:1,自引:0,他引:1  
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。  相似文献   

18.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号