首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

2.
为了有效地进行语音变换,改善变换后语音的自然度和目标人倾向度.依据语音信号传播机理和(Fourier-Bessel)展开式系数对语音信号的表现能力,提出了利用F-B展开系数作为变换参数.在该算法中,根据F-B展开系数无语音相位信息的特点,提出基于最大基频相位的语音分帧算法;针对F-B展开式数据量过大的问题,提出了基于Karhunen-Loeve变换的参数压缩算法,转换模型使用GMM(Gaussian mixture model)模型.对算法进行了仿真实验.对变换后语音所进行的ABX测试表明,算法能够较好地完成语音变换,变换后语音的目标人趋向度比较高.  相似文献   

3.
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%.  相似文献   

4.
为了满足移动语音通信中对语音内容保持操作的鲁棒性和区分性,并实现高效认证等要求,提出一种基于线性预测最小均方差(LP-MMSE)的高效语音感知哈希认证算法.该算法首先对待认证语音进行预处理、分帧和加窗后的语音信号进行线性预测分析(LPC)得到其最小均方差(MMSE)系数矩阵;然后对分帧后的语音利用谱熵法计算得到每帧的谱熵值参数矩阵;最后结合上述两个矩阵,生成最终的二进制感知哈希序列.仿真结果表明,该算法的感知哈希摘要性优于现有的其它方法并对内容保持操作具有较好的鲁棒性和区分性,认证效率高,能够满足语音通信实时认证的要求.  相似文献   

5.
笔者以2007年11月中巴资源卫星多光谱遥感影像数据为例,选择山东省济宁市市中区作为研究区,利用ERDASImagine9.2遥感影像处理软件对数据进行预处理后,运用最大似然法(Maximum Likelihood)、马氏距离法(Mahalanobis Distance)、最小距离法(Minimum Distance)进行监督分类试验.然后对分类后的结果进行主观和客观的分析,并评价各种分类结果的精度,为用户进行影像分类前选择分类方法提供参考.  相似文献   

6.
为了研究空中交通管理领域中的语音增强问题,并且节约存储资源,提出了一个新的语音增强方法.在基于全卷积神经网络(FCN)的基础上加入了跳跃连接(Skip Connection),并引入次要特征来进行联合学习.具体而言,使用语音的对数功率谱(LPS)作为网络的主要训练特征,引入对数梅尔倒谱系数(L-MFCC)作为网络的次要训练特征,来联合优化网络参数.实验证明,相较于单个LPS特征输入的架构,结合LPS和L-MFCC的多特征网络架构具有更好的语音增强性能表现,且作为次要特征的L-MFCC还可以用作其它用途.实验还证明,跳跃连接的加入可以很好的提高FCN的网络性能,且相较于基线的深度神经网络(DNN)模型,新的网络结构在相同参数数量的情况下,要具有更好的性能.  相似文献   

7.
针对变分模态分解(VMD:Variational Mode Decomposition)算法在分解信号时参数选择不准确导致降噪效果不理想的问题,提出一种改进的蜜獾优化算法(LHBA:Levy Honey Badger Algorithm)与VMD结合的降噪算法。首先,利用LHBA算法优选VMD的分解模态数K和惩罚因子α;其次,利用优化后的参数进行VMD信号分解;最后,计算各模态分量与原始信号之间的豪斯多夫距离(HD:Hausdorff Distance),选取有效模态分量进行信号降噪处理。实验结果表明,该算法与HBA(Honey Badger Algorithm)-VMD、 GA(Genetic Algorithm)-VMD和PSO(Particle Swarm Optimization)-VMD相比,其4种评价指标均优于其他对比算法,具有较好的降噪效果,验证了该算法的有效性和先进性。  相似文献   

8.
提出了一种新的语音说话人转换算法,利用变分贝叶斯方法估计高斯混合模型参数,进而将其应用于语音转换的声道谱参数映射过程,实现说话人身份转换.将变分贝叶斯算法用于模型参数的估计,一方面解决了训练数据量稀少情况下容易使模型产生"过拟合"的问题,另一方面通过将模型参数概率化,使得参数估计问题不再是"点估计",而成为了"全局估计",因此在一定程度上提高了模型的精度.主观和客观实验结果表明:将基于变分贝叶斯估计得到的统计模型用于语音声道谱参数的转换,明显提高了在训练数据稀少的情况下系统的鲁棒性,同时转换后语音的音质和说话人个性特征均优于经典的语音转换系统.  相似文献   

9.
为了能够更加准确地评价语音包丢失对基于IP的语音传输(voice over internet protocol,VoIP)的语音质量的损伤,对ITU-T G.107建议书提出的语音质量预测模型E-Model中计算丢包与编码造成的损伤Ie-eff的方法作出改进,在综合考虑语音包的内部特性和存在突发连续丢包情况后,提出利用在固定语音长度下,语音实际损失时间Tloss来衡量语音包丢失造成的语音损伤.仿真结果表明,相比原有模型,改进后的模型得到的语音质量评分同主观语音质量评估方法(perceptual evaluation of speech quality,PESQ)评分相比,皮尔森相关系数平均提高了0.045 8,均方根误差平均降低了0.053 4,改进后的E-Model模型在评价语音质量时与PESQ更具有一致性,可以更为准确地预测VoIP通信的语音质量.  相似文献   

10.
针对变分模态分解(VMD:Variational Mode Decomposition)算法分解后有效模态分量选择困难以及去噪效果不理想等问题,将粒子群(PSO:Particle Swarm Optimization)与VMD算法结合,提出一种基于混沌和Sigmoid函数改进PSO的优化算法.利用改进的PSO算法优化VMD的分解模态数κ和惩罚因子α,进行模态分解,然后计算各模态分量概率密度函数与信号概率密度函数之间的欧氏距离(ED:Euclidean Distance),选取有效模态分量重构信号.实验结果表明,该算法与VMD-CORR(Variational Mode Decomposition-Correlation Coeffificient)算法和EMD-ED(Empirical Mode Decomposition-Euclidean Distance)算法相比,仿真信号和实际管道泄漏信号都得到了较好的去噪效果,并验证了其在管道泄漏检测中的有效性.  相似文献   

11.
提出一种具有良好抗噪性的语音特征分析方法.将语音信号的短时自相关序列进行时间方向上的平滑处理,然后利用平滑后的序列代替原语音信号进行线性预测分析,从而得到线性预测倒谱系数.实验表明,利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数.  相似文献   

12.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。  相似文献   

13.
针对现有语音活动检测特征易受各种环境噪声影响而导致检测性能恶化的问题, 提出基于相位调制特征的语音活动检测算法。相位调制特征能充分表征语音动态特性, 与静态特征相比, 更能体现语音和噪声间的差异, 从而保证良好检测性能。与传统美尔频率倒谱系数特征的检测对比实验结果表明, 相位调制特征明显优于美尔频率倒谱系数。  相似文献   

14.
连接数字语音识别系统的DSP实时实现   总被引:2,自引:0,他引:2  
:针对各种数字信息,实现了一种基于TMS320C5x 评价模块(EVM)的与特定人无关的连接数字语音识别系统.在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum -Welch 重估算法,有效地提高了系统的识别率.给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响.在具体实现中,着重处理了抗噪及实时实现问题.实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到92% ,为其实用化提供了较为重要的技术途径.  相似文献   

15.
为了更好地区分正弦激励线性预测声码器中待量化基音周期参数矢量各维基音周期参数的重要性,提高合成语音质量,提出了一种新的权重系数计算方法。发现权重系数的计算应考虑当前语音帧所有子带的清浊音度参数,而不仅仅是第一个子带的清浊音度参数,这样能够更好地区分各语音帧基音周期参数的重要性。将各语音帧的所有子带清浊音度参数相加,其和作为基音周期参数量化时的权重系数。测试结果表明,与仅将第一个子带的清浊音度参数作为权重系数相比,新方案能使合成语音质量MOS有较大提高。  相似文献   

16.
针对非连续、 非平稳语音信号中含有噪声的问题, 提出一种基于参数优化的变分模态分解去噪算法. 首先, 利用灰狼优化算法搜寻变分模态分解算法的最优分解参数组合——分解模态数K和惩罚因子α, 通过使用获得的参数组合分解语音信号以获得K个特征模态函数分量IMF; 其次, 利用相关系数选择有效模态分量, 并用小波阈值处理无效模态分量; 最后, 重构小波阈值处理后的模态分量和有效模态分量以对语音信号进行去噪. 实验结果表明, 该算法与其他经典算法相比能有效提升信噪比, 降低均方误差, 提高语音信号的质量.  相似文献   

17.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

18.
音频比对有别于语音识别,音频比对不存在音频重构.在保证音频主要信息不丢失的前提下,采用二阶Haar小波变换压缩原始音频,以音频帧的方式提取出能代表音频主要信息特征的质心、均方根和前12个Mel倒谱系数,并分别计算这3类参数的欧氏距离,根据欧氏距离的值与阀值ε之间的关系,完成音频间的比对任务.经实践证明,这套方案对于音频比对具有较高的准确性和较好的实时性.  相似文献   

19.
混响声场中语音识别方法研究   总被引:1,自引:4,他引:1  
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC,即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号