首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
张雅楠  刘震 《太原科技》2014,(5):91-92,95
随着科学技术的发展,声纹识别系统应用广泛。介绍了一种新颖的语音信号识别方法,即使用emd分解语音信号,提取语音信号的时域与频域特征,将获得的信号特征输入神经网络,通过神经网络进行语音信号的识别。  相似文献   

2.
给出了一种基于小波变换的汉语语音信号预处理的方法。通过小波变换中的Mallat算法来分解汉语语音信号,能够消除信号冗余度,提高数据压缩比,而不影响语音信号的真实效果。同时还给出了小波变换原理和Mallat算法以及实验结果。  相似文献   

3.
论文讨论了语音信号在理工科课程教学中的实际应用,利用语音信号直观地描述了《信号与系统》课程中所介绍的理论.学生通过熟悉的语音系统更好地理解了信号的本质及系统理论,有效地掌握了课程中理论的实际应用场合,提高了学习兴趣,增强了教学效果.  相似文献   

4.
介绍了一款基于Matlab的语音信号采集与分析系统,该系统通过声卡和Matlab的数据采集工具箱低成本地实现了语音信号的实时采集,并利用Matlab强大的数值计算和信号处理功能高精度地完成了语音信号的分析工作,具有使用方便、价格便宜、通用性强等优点。  相似文献   

5.
基于语音信号与心电信号的多模态情感识别   总被引:1,自引:0,他引:1  
通过采集与分析语音信号和心电信号,研究了相应的情感特征与融合算法.首先,通过噪声刺激和观看影视片段的方式分别诱发烦躁情感和喜悦情感,并采集了相应情感状态下的语音信号和心电信号.然后,提取韵律、音质特征和心率变异性特征分别作为语音信号和心电信号的情感特征.最后,利用加权融合和特征空间变换的方法分别对判决层和特征层进行融合,并比较了这2种融合算法在语音信号与心电信号融合情感识别中的性能.实验结果表明:在相同测试条件下,基于心电信号和基于语音信号的单模态情感分类器获得的平均识别率分别为71%和80%;通过特征层融合,多模态分类器的识别率则达到90%以上;特征层融合算法的平均识别率高于判决层融合算法.因此,依据语音信号、心电信号等不同来源的情感特征可以构建出可靠的情感识别系统.  相似文献   

6.
基于语音信号在离散余弦基下的近似稀疏性,对语音信号采用压缩感知技术进行压缩和重构,研究了分析窗长固定时重构误差与观测点数的关系, 针对低压缩比下重构信号"noisy"的特性,提出对重构信号进行小波去噪联合低通滤波的方法以改善重构语音的质量,并研究了低压缩比下分析窗长对重构信号质量的影响.仿真结果表明低压缩比下,合理选取分析窗长,并采用小波去噪联合低通滤波的处理方法可以明显改善重构语音的质量.  相似文献   

7.
为了解决语音信号参考独立分量分析(ICA with Reference,ICA-R)算法中参考信号选取难的问题.依据语音信号传播机理和Bessel函数展开系数对语音信号的表征能力,提出了基于Bessel函数展开的语音信号建模方法,利用Bessel函数展开系数作为变换系数,用少量的系数构建ICA-R中的参考信号来实现对期望语音信号的提取,并将该方法运用到语音信号隐藏技术中.仿真实验结果表明该方法能够较好地从混合语音信号中提取期望语音信号,并能有效地实现语音信号的隐藏与恢复.  相似文献   

8.
针对低信噪比语音信号,提出一种基于双采样技术的语音端点检测与语音增强算法。首先,利用双采样技术获取两组数据。其次,利用经验模态分解和希尔伯特变换同时对这两组数据进行语音端点检测。利用语音端点检测的结果以及最大相似度分析找出带噪语音信号中低信噪比的固有模态分量,再对其进行时域阈值滤波处理,得到初步增强后的语音信号。然后通过数据融合处理提高语音增强效果。仿真结果显示,和现有算法相比,文章所提算法的检测率至少提高了7%,误检率至少降低了6%。  相似文献   

9.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

10.
研究了语音信号的混沌动力学机制,并用相空间重建图、语音信号极坐标表示、语音信号时域波形等方式研究了语音信号的分维数,改进了Box-Counting的分维数计算方法,改进后的计算方法准确可靠、处理速度快。用该方法对汉语语音的分维数进行,统计分析,得到汉语语音的基本分形特征。  相似文献   

11.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

12.
基于G.729编码参数的语音特征及其应用   总被引:1,自引:1,他引:1  
目的从低比特率语音编码参数中直接提取语音特征。方法针对G.729编码技术提出了一种从编码参数直接计算倒谱系数和基音/能量轨迹特征的方法。结果该方法通过对残差信号进行线性预测分析,提高了谱包络的精确程度,并从码本增益和延时参数中得到了基音/能量轨迹特征。结论说话人识别的实验结果显示,新方案能够使得基于G.729编码参数的说话人识别效果得到较明显的提高,达到了用解码语音进行识别的水平。  相似文献   

13.
高质量的0.6 kb/s声码器算法   总被引:13,自引:2,他引:13  
为满足语音信息存贮和交流对极低速率下语音压缩编码的需求,提出了一种0.6 kb/s声码器算法.此算法基于线性预测正弦激励模型,在极低码率下获得高质量的合成语音,提出清浊音定位和量化方法,应用了多帧参数联合矢量量化技术,以及多带正弦混合激励、谱增强等技术.主观听觉测试显示,在0.6 kb/s的速率下,此声码器合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(DRT)的分数为89.5%, 而且在10-2的随机误码的信道条件下仍然具有很好的可懂度.实验表明 利用帧间参数相关性及矢量量化的方法可以将编码速率大幅度压低而保持较高清晰度.  相似文献   

14.
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.   相似文献   

15.
使用牛顿算法的韧性M估计方法来估计语音信号的线性预测参数.该方法考虑了语音信号模型浊音激励源的非高斯特性,它能消除浊音激励中远离值的影响.使用合成语音信号数据的实验表明,与常规的线性预测方法比较,所提出的方法能给出更有效和更小偏倚的估计.  相似文献   

16.
针对传统话音端点检测方法在短波低信噪比信道下检测准确率低的问题,提出一种将深度生成对抗网络和自适应参数的子带对数能熵积相结合的话音端点检测方法。该方法首先利用深度生成对抗网络话音增强方法降低噪声对待检测信号的影响,再以自适应参数的子带对数能熵积这一新的话音特征参数为阈值,使用自适应阈值双门限检测法完成话音端点检测。仿真实验结果表明,该方法对于-5 dB信噪比的标准话音库检测的平均加权错误测度仅为13.5%,而对于实际短波侦察信号库检测的平均加权错误测度为16.7%,均优于能零熵法和多窗谱估计谱减与能熵积法。  相似文献   

17.
LSP参数的快速计算及其高效量化研究   总被引:2,自引:1,他引:2       下载免费PDF全文
线谱对参数是语音信号处理中声道模型的重要参数,其计算与量化直接关系到合成语音的质量,通常计算方法复杂,计算量大。利用Chebyshev多项式推导了一种快速计算LSP参数的算法,并研究了一种采用多级矢量量化方法实现18比特/帧的LSP参数高效量化。采用本文方法不仅保持了必要的量化精度,而且运算量大大降低。  相似文献   

18.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

19.
使用牛顿算法的韧性(Robust)M估计方法来估计自回归(AR)语音信号模型的线性预测参数,该方法考虑了语音信号模型浊音激励源的非高斯特性,能有效地抑制异常值(outlier)的影响。使用所提出的韧性线预测算法来检测共振峰,获得了比使用常规线性预测方法更准确的结果  相似文献   

20.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号