期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张毅李艳花刘全杰杨红梅曾莉《重庆邮电学院学报(自然科学版)》2009,(6)

作为一种人机信息交互技术,语音识别技术得到了广泛的应用。介绍了基于凌阳十六位单片机SPCE061A的语音识别系统,并且采用了以传统的线性预测倒谱系数(LPCC)与分形维数相结合的混合参数作为特征参数的语音识别方法。LPCC方法是体现说话人特定的声道共振特性的线性预测方法,而分形维数则可以定量的描述语音气流中的非线性混沌特征。实验结果表明,基于LPCC与分形维数混合参数的语音识别方法要比单一的LPCC参数语音识别方法识别效果好。相似文献

2.

基于改进混合CTC/attention架构的端到端普通话语音识别

杨鸿武周刚《西北师范大学学报(自然科学版)》2019,(3)

端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率. 相似文献

3.

噪声环境下话者识别系统的特征提取

王蕾孟慧杰《科技信息》2010,(33):48-49

说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语音信号的特征提取。应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括LPCC、MEL倒谱系数、线性预测倒谱系数等,对这些参数进行分析和比较,以达到话者识别的目的。相似文献

4.

与文本无关的单训练样本说话人识别

《陕西师范大学学报(自然科学版)》2016,(5)

针对现有的说话人识别方法对环境噪声较为敏感的问题,提出了一种与文本无关的单训练样本说话人识别方法。该方法能够提取语音时频谱的局部特征,此特征不仅对白噪声、高斯噪声、粉红噪声有很强的鲁棒性,而且能够充分反映说话人的基本发声特性。针对该局部特征的基本特点,给出了适合该局部特征的贝叶斯决策方法。对英文与汉语语音数据库的仿真实验表明,该识别方法可以实现单训练样本下的说话人识别,识别精度明显高于现有的Mel频率倒谱系数(MFCC)与线性预测编码(LPCC)语音特征,而且对白噪声等各类环境噪声有较高的鲁棒性。相似文献

5.

VQ声纹识别算法和实验

李爱平党幼云《西安工程科技学院学报》2007,21(6):848-851

采用线性预测倒谱系数（linear prediction cepstrum coefficient, LPCC）作为语音的特征参数，矢量量化（vector quantity，VQ）方法进行模式匹配，探讨声纹识别以实现身份认证，并对此识别方法进行了相关的实验．通过验证，这种方法可以区分不同的说话人，并且在做说话人辨认实验时可达到较高的识别率．相似文献

6.

管制指令特征参数提取研究 总被引：2，自引：1，他引：1

何昕蒋豪韩丹《科学技术与工程》2015,15(20)

在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。相似文献

7.

基于径向基神经网络的数字"0"～"9"语音识别 总被引：1，自引：0，他引：1

余华李海洋李启元《江西师范大学学报(自然科学版)》2009,33(6)

介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上. 相似文献

8.

基于MF-DFA的语音情感识别

叶吉祥张密霞龚希龄《长沙理工大学学报(自然科学版)》2011,(2):67-71

针对语音情感线性参数在刻画不同情感类型特征上的不足，将多重分形理论引人语音情感识别中．通过分析不同语音情感状态下的多重分形特征，提取多重分形谱参数和广义hurst指数作为新的语音情感特征参数，并结合传统语音声学特征，采用支持向量机SVM对其进行语音情感识别．试验结果表明，该方法可使系统的准确率和稳定性得到有效提高．非线... 相似文献

9.

一种基于Fisher准则的说话人识别方法研究

张芸李昕郑宇杨庆涛《兰州大学学报(自然科学版)》2007,43(2):92-97

在说话人识别系统中,提高反映说话人个性的语音信号特征参数的有效性和实时性是问题之一.本文在使用线性预测系数倒谱(LPCC)和美尔倒谱系数(MFCC)计算特征参数的基础上利用Fisher准则,构造了一种新的混合特征参数.这种新的参数在不增加系统计算量的同时,结合了LPCC和MFCC各自的优点,具有更好地表征说话人特征的能力,并在一定程度上消除特征的信息冗余,有利于信息的实时处理. 相似文献

10.

一种新型的与文本相关的说话人识别方法研究

下载免费PDF全文

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献

11.

Fractal dimension of voice-signal waveforms 总被引：2，自引：0，他引：2

Xie Yu-qiong Wen Zhi-xiong 《武汉大学学报:自然科学英文版》2002,7(4):399-402

The fractal dimension is one important parameter that characterizes waveforms. In this paper, we derive a new method to calculate fractal dimension of digital voice-signal waveforms. We show that fractal dimension is an efficient tool for speaker recognition or speech recognition. It can be used to identify different speakers or distinguish speech. We apply our results to Chinese speaker recognition and numerical experiment shows that fractal dimension is an efficient parameter to characterize individual Chinese speakers. We have developed a semiautomatic voiceprint analysis system based on the theory of this paper and former researches. Foundation item: Supported by the Special Funds for May State Basic Research Projects Biography: Xie Yu-qiong(1964-), female, Ph. D candidate, research direction: fractal geometry. 相似文献

12.

基于G.729编码参数的语音特征及其应用 总被引：1，自引：1，他引：1

陈皓付中华赵荣椿《西北大学学报(自然科学版)》2005,35(3):266-269

目的从低比特率语音编码参数中直接提取语音特征。方法针对G．729编码技术提出了一种从编码参数直接计算倒谱系数和基音／能量轨迹特征的方法。结果该方法通过对残差信号进行线性预测分析，提高了谱包络的精确程度，并从码本增益和延时参数中得到了基音／能量轨迹特征。结论说话人识别的实验结果显示，新方案能够使得基于G．729编码参数的说话人识别效果得到较明显的提高，达到了用解码语音进行识别的水平。相似文献

13.

基于BPNN/HMM神经网络的声学模型研究 总被引：1，自引：0，他引：1

李凡吴军黄刚《华中科技大学学报(自然科学版)》2004,32(9):9-11

研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型，BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量，而删则对转换后的纯净语音特征矢量进行分类，从模型级补偿的方面来提高语音识别系统的鲁棒性．讨论了一种基于线性预测的MKCC语音特征提取方法，该方法把提取出的失真语音特征矢量作为神经网络的输入，从而实现了特征参数级去噪处理的目的．相似文献

14.

基于EMD法的语音信号特征提取方法研究

王彪《科学技术与工程》2012,12(10):2462-2464

为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。相似文献

15.

基于HHT的语音特征参数提取及其在说话人识别中的应用

刘丽伟张瑶赵孔新钱锋《吉林工学院学报》2009,30(6):696-701

阐述了分析非线性、非平稳信号的Hilbert—Huang变换（HHT）算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。相似文献

16.

加性噪声环境下语音特征参数提取方法的研究

张昊慧《淮阴师范学院学报(自然科学版)》2010,9(4)

提出一种具有良好抗噪性的语音特征分析方法.将语音信号的短时自相关序列进行时间方向上的平滑处理,然后利用平滑后的序列代替原语音信号进行线性预测分析,从而得到线性预测倒谱系数.实验表明,利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数. 相似文献

17.

语音信号非线性特征的研究 总被引：4，自引：0，他引：4

下载免费PDF全文

陈亮张雄伟《解放军理工大学学报(自然科学版)》2000,1(2):11-17

随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Ｌｙａｐｕｎｏｖ指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计相似文献