首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
本文探讨了一种汉语情感语音合成的方案。首先,根据汉语韵律的分层特点,采用SFC基频时长韵律模型,从语料库中提取出反映汉语情感特征的基频参数和时长参数曲线;然后,采用STRAIGHT语音分析与合成算法,用提取出的反映情感特征的韵律参数控制合成过程.从而合成出带有情感的汉语语音。  相似文献   

2.
提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力.  相似文献   

3.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

4.
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力.  相似文献   

5.
藏语语音合成语料数据库的优劣对合成语音质量有很大的影响,语料的设计考虑了音段和韵律,语料库中包含藏语的音节、词语、独白语句和情景对话语等.  相似文献   

6.
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。  相似文献   

7.
提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CnV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果.  相似文献   

8.
小波变换在语音变速上的应用   总被引:1,自引:0,他引:1  
对语音生成及其特征进行描述,提出了一种基于保持音调前提下的语音变速方法⒚利用基频估值可以得到语音的基音周期,适当地复制或删除若干个基音周期可以改变语音的语速,而音调基本保持不变  相似文献   

9.
语调是语音分析和合成领域关注的重要课题,可计算的语调模型是实现语调控制的关键。该文分析了大规模语句的音节音高在句子中的变化,归纳了语调模式。陈述语调主要表现为基调的升降和音高下倾;疑问语调主要特点是疑问焦点的音高提升和调型变化。该文提出了一种陈述语调归一化描述方法,以及疑问语调调型差异模型。利用基于隐Markov模型的语音合成系统的控制机制,实现了对语调的控制。实验表明:基于陈述句语调归一化描述方法模拟了陈述句语调的变化,基于疑问语调调型差异模型实现了陈述到疑问语调的转换。语调控制使合成语音的表现力得到了提高。  相似文献   

10.
汉语语音的声调是个人语气与情感状态最直接的表达,是体现汉语语言状态最重要的特征之一。为了使得语音合成的逼真度得到有效的提高,讲话者的话语更加具有区分度,通过加入声调参数特征实现语音语调变换,以期成为情感识别和语音识别的准确度最有力的助推剂,弥补语音合成结果在情感特征以及语音演唱方面的不足。分别对汉语阴平、阳平、上声、去声采用基频提取的方式进行声调的分析、研究,将得到的基频曲线采用多项式函数拟合的方法对汉语4种声调进行重新构建,从数学角度对汉语声调进行分析、重构,采用三角函数曲线模拟随时间变化的语音基频曲线,根据共振峰频率将曲线进行叠加,达到了95.91%的满意的识别结果。结果表明:采用多项式函数拟合方法实现汉语4种声调的语音合成,更好地还原了语音的数学本质,使得抽象化的语音表现得更直观可控。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号