首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 625 毫秒
1.
在语音压缩编码中,矢量量化占有很大比重和计算量。码本的好坏与方法的选择有很大关系。将基于神经网络的SOFM(自组织特征映射算法)和HMM(隐含马尔可夫过程)应用于矢量量化,从而产生更为优良的码本。  相似文献   

2.
自适应矢量量化在语音信号处理中有广泛地应用 ,提出一种基于SFCM算法的自适应矢量量化码本的训练方法 ,其特点是通过模糊聚类方法 ,重新调整训练样本与码字之间的隶属度 ,达到最小编码失真 ,使码本更适合新说话人 ,且计算简单·本方法的实验结果表明 ,可以使编码平均失真下降·基于SFCM自适应矢量量化码本训练方法@李晶皎 @夏晓东 @顾树生  相似文献   

3.
4kbit/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法。在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率。在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量。对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量。对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度。经非正式听音测试,4kbit/sFS-ACELP的合成语音质量超过了北美8kbit/sVSELP,接近G.7298kbit/sCS-ACELP,MOS分约为3.9。  相似文献   

4.
为了有效地减少语音编码的比特数、降低量化误差以及提高解码语音质量,提出了一种二级矢量量化的LPC声码器算法.该算法在模糊聚类与LBG级联的VQ算法的基础上,进一步采用二级矢量量化算法对特征参数矢量进行量化.特征参数为语音的两个特征值:基音周期与增益.第一级码本为矢量码本;第二级码本为误差码本.将该算法应用于LPC声码器中进行仿真实验,结果表明:该算法能有效地降低量化比特数并且减少了量化误差,从而使解码语音质量得到改善.  相似文献   

5.
提出用码激励线性预测(CELP)实现GSM半速率编码器的一种方案。该方案把中心削波和结构化码本相结合,并推导了加权滤波器响应的公式,使码本搜索的计算量大大降低,存储量显著减少,并获得高质量语音。计算机模拟结果表明,本方案编码速率为675kbit/s,合成语音MOS得分为35dB~40dB。该方案可以在一块TMS320C30上实时实现。  相似文献   

6.
为了解决语音参数编码算法中多级矢量量化中码本尺寸过大,存储量过大,导致搜索复杂度大的问题,提出了多级矢量量化中的码本共享的迭代算法。该算法基于多级矢量量化中各级待量化码矢之间的相似性,采用模拟退火算法,通过迭代得出共享变换系数。在1.2 kb/s的正弦激励线性预测声码器中,采用该算法对线谱对参数进行多级矢量量化。测试结果表明:在共享级别选择恰当时,可降低存储量20%,同时重建语音谱失真损失约为0.02 dB,可见该算法可以有效降低码本容量,同时对语音质量影响极小。  相似文献   

7.
本文提出了一种基于模糊矢量量化(FVQ)和隐马尔柯夫模型(HMM)模糊训练的语音识别新方法.利用模糊矢量量化替代了传统方法中的矢量量化,语音特征参数序列经过模糊矢量量化后得到模糊观察符号序列.在此基础上提取出一个反映训练样本总体随机变化特性的模糊观察符号序列,然后用它对该音节的HMM进行一次性全局训练,训练算法经传统的Baum-Welch算法改进得到.经十个汉语数字的对比实验表明,该训练算法大大提高了系统的训练速度,模糊矢量量化与传统的矢量量化相比,不仅提高了隐马尔柯夫模型的鲁棒性,进而提高了系统的识别率,而且在语音训练数据不充足的情况下,也能得到很好的识别性能.  相似文献   

8.
采用模糊切分实现非特定人连接数字语音识别   总被引:1,自引:0,他引:1  
选用倒谱特征、△倒谱特征、能量类特征等多个语音信号特征,采用多码本和HMM/VQ技术实现非特定人连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

9.
选用倒谱特征、△倒谱特征、能量类特征等个语音信号特征,采用多码本和HMM/VQ技术实现非特定连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

10.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

11.
自适应矢量量化在语音信号处理中有广泛地应用,提出了一种基于SFCM算法的自适应矢量量化码本的训练方法,其特点是通过模糊聚类方法,重新调整训练样本与码字之间的隶属度,达到最小编码失真,使码本更适合新说话人,且计算简单·实验结果表明,可以使编码平均失真下降·  相似文献   

12.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

13.
8kbit/s短延时语音编码算法LD-ACELP,采用了代数码本激励线性预测(ACELP)的编码方法,利用语音的帧间相关性对线谱对参数采用了分裂式矢量量化技术,并采用高效的码本结构、码本搜索技术和增益矢量量化技术来获得较高的语音合成质量和较短的算法延时。LD-ACELP的帧长为10ms,算法延时为15ms。通过信噪比及人耳主观听觉实验等性能测试表明,该算法具有与国际电联16kb/s短延时语音编码算法LD-CELP(G.728)相当的语音合成质量。  相似文献   

14.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

15.
针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。  相似文献   

16.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。  相似文献   

17.
本文评述了矢量量化法用于语音识别研究的现状,并提出一种新的识别方案——将考虑能量信息的多段码书矢量量化技术应用于汉语孤立词语音识别。实验证明该法确实可在保证较高识别精度的前提下,大大加快识别速度。  相似文献   

18.
带有帧间级间预测的线谱频率参数多级矢量量化   总被引:2,自引:1,他引:1  
为在极低速率下实现高质量的语音编码,提出一种高效的带有帧间及级间预测的线谱频率参数多级码本矢量量化(IFP-MSVQ-ISP)算法。算法利用多级矢量量化中上一级码本的选定码矢对残差矢量进行预测,对去除预测分量的残差矢量再进行下一级矢量量化。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比,能够有效降低线谱频率参数的量化误差,使谱失真降低0.1 dB以上,合成语音客观MOS提高0.02以上。该算法的实现对极低速率下语音压缩编码算法的研究具有重要的参考价值。  相似文献   

19.
在语音压缩编码中,矢量量化占有很大比重和计算量.码本的好坏与方法的选择有很大的关系.笔者介绍了一种方法,将神经网络和隐含马尔可夫过程应用于矢量量化,从而产生了更为优良的码本.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号