首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。该文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出一种基于空间声场扩散信息的时频递归平均混响功率谱估计方法,并通过谱增强的方法实现对混响的有效抑制。该文提出的算法在实录房间冲击响应(room impulse response,RIR)上实现了混响环境中语音增强,算法在分段信混比(segmental signal-to-reverberation ratio,SSRR)、对数谱距离(log spec-tral distortion,LSD)以及主观语音质量评估(perceptual e-valuation of speech quality-mean opinion score,PESQ-MOS)方面都表现出性能的提升。  相似文献   

2.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

3.
提出了一种评估非母语英语学习者的词汇应用能力的方法,用于提高英语为非母语者的自然语音响应自动评分系统的精度.方法根据词表中每个词在参照语料库的出现频率来估算词汇复杂度,并评定响应中词汇的平均难度等级.基于口语响应中的单词,得出3种特征:相关覆盖率、平均词排名及平均词频,研究了它们对人工语言能力得分的影响程度.最后,探讨了词汇分布特征对自动语音评分系统的影响,重点在于参照语料库的文类和词项类型2个因素的影响.  相似文献   

4.
为了提高通信系统的抗干扰和抗攻击能力,尽可能降低语音编码速率.提出了一种O.6 kb/s语音编码算法.算法基于3帧联合,对多帧联合参数采用高效矢量量化,在降低语音编码速率的条件下保证语音编码质量.其中,对线谱对参数采用预测多模式多级矢量量化码本结构.在码本设计过程中,提出了多模式渐进闭环设计,对各类码本联合优化,并联合优化预测器和量化器,可以有效提高线谱对参数量化质量.在译码方,采用多带混和谐波激励提高合成语音清晰度.测试结果表明,该语音编码算法合成语音PESQ(perceptualevaluation of speech quality)得分可以达到2.7,汉语诊断押韵测试DRT(diagnostic rhyme test)得分可以达到89.7.  相似文献   

5.
调频语音通信技术具有抗干扰性能好、易于实现的特点,但在水声信道多径条件下调频体制传输的水声语音质量受到严重影响.针对此问题在调频语音通信体制下引入时间反转处理,通过抑制多径效应聚焦能量提高信号信噪比,改善调频水声语音通信性能,并采用客观语音质量评估(perceptual evaluation of speech quality,PESQ)方法对调频水声语音通信质量进行评估.海洋试验证明,时间反转处理可有效提高调频水声语音通信系统性能.  相似文献   

6.
带噪语音可看成由独立的噪声信号和语音信号经某种方式混合而成,传统语音增强方法需要对噪声信号和干净语音信号的独立性和特征分布做出假设,不合理的假设会造成噪声残留、语音失真等问题,导致语音增强效果不佳。此外,噪声本身的随机性和突变性也会影响传统语音增强方法的鲁棒性。针对这些问题,使用生成对抗网络来对语音进行增强,给出一种基于Wasserstein 距离的生成对抗网络(Wasserstein generative adversarial nets, WGAN)的语音增强方法来加快训练速度和稳定训练过程。该方法无需人工提取声学特征,且使语音增强系统的泛化能力得以提升,在匹配噪声集和不匹配噪声集中都有良好的增强效果。实验结果表明,使用训练出的端对端语音增强模型后,语音信号的客观评价标准(perceptual evaluation of speech quality,PESQ)平均得到23.97%的提高。  相似文献   

7.
设计孤立词的语音识别系统,对小词汇量、非特定人的语音进行识别。利用HTK(Hidden Markov Model Toolkit,隐马尔科夫模型工具箱)语音识别工具包进行系统的搭建,从语音识别的原理出发,对每一个单词建立和训练隐马尔科夫模型,探讨语音识别的基本流程和实现方法,为连续语音识别研究打下基础。实验结果显示,隐马尔科夫模型对孤立词具有良好的识别性能。在正常说话语境下,对语料库中单词的识别率可达到80%。  相似文献   

8.
国际上对自动语种识别进行了广泛的研究,提出了各种各样的方法,美国国家标准技术研究所(NIST)多年的评测表明,基于并行音素识别(parallel phoneme recognition language modeling,PPRLM)的方法取得了很好的性能.该文提出了一种基于多种语言的音素识别方法的自动语种识别系统,系统中Multilingual音素集是使用基于数据驱动聚类获得.通过真实环境电话语音测试表明,该方法在只使用了很少的识别时间的情况下,获得了跟传统的PPRLM系统可比的识别正确率.同时经过与PPRLM系统融合后,获得了更好的性能,跟其他主流的几种语种识别方法也有可比的性能.  相似文献   

9.
为了能够更加准确地评价语音包丢失对基于IP的语音传输(voice over internet protocol,VoIP)的语音质量的损伤,对ITU-T G.107建议书提出的语音质量预测模型E-Model中计算丢包与编码造成的损伤Ie-eff的方法作出改进,在综合考虑语音包的内部特性和存在突发连续丢包情况后,提出利用在固定语音长度下,语音实际损失时间Tloss来衡量语音包丢失造成的语音损伤.仿真结果表明,相比原有模型,改进后的模型得到的语音质量评分同主观语音质量评估方法(perceptual evaluation of speech quality,PESQ)评分相比,皮尔森相关系数平均提高了0.045 8,均方根误差平均降低了0.053 4,改进后的E-Model模型在评价语音质量时与PESQ更具有一致性,可以更为准确地预测VoIP通信的语音质量.  相似文献   

10.
基于神经网络的语音识别研究   总被引:3,自引:0,他引:3  
由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具.为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较.介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构.其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别.实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号