首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语境特征下决策树叶子结点中基元的语境特征F′.统计F′中每一个语境特征相对于F*的变化,根据语境特征变化的概率对权重进行调整.实验结果表明,这种方法能够训练出合理的语境特征权重,使得合成语音的自然度有一定提高.同时,利用这种方法还可以对语音合成系统进行实时优化.  相似文献   

2.
采用传统激励模型的基于HMM的文语转换系统的合成语音自然度不高,主要原因是其采用的激励模型用脉冲串作为浊音段激励和白噪声作为清音段激励过于粗糙,不能很好地模拟自然语音的激励.借鉴MELP语音编码算法,把混合激励模型应用到系统中,对合成语音激励信号进行改进.试验结果表明,混合激励模型大大提高了系统的自然度.  相似文献   

3.
为提高语音合成系统的性能,产生自然流畅的合成语音,该文结合多种拼接点过渡平滑算法,提出了一种以语境相关的音素为基本单元的基于隐Markov(hidden Markov model,HMM)模型的英语拼接合成系统.该合成方法兼有拼接合成以及参数合成的优点,具有相对的灵活性,以及一定的语音自然度.以音素为基本单元尽可能减少了拼接点的个数,降低拼接失真.实验结果表明,多种平滑算法的采用,保证了拼接边界过渡平滑连贯,提高了最终的拼接效果.  相似文献   

4.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

5.
本文探讨了一种汉语情感语音合成的方案。首先,根据汉语韵律的分层特点,采用SFC基频时长韵律模型,从语料库中提取出反映汉语情感特征的基频参数和时长参数曲线;然后,采用STRAIGHT语音分析与合成算法,用提取出的反映情感特征的韵律参数控制合成过程.从而合成出带有情感的汉语语音。  相似文献   

6.
该文介绍了一个实用的汉语文语转换系统NLG-TTS.该系统的输入为自然汉语文本,对输入文本进行规格化处理和分词处理之后,根据汉语语言学规则对文本进行音位和韵律标注;系统选用汉语有调音节和常用词为语音合成基元,音元数据的压缩选用矢量和激励线性预测(VSELP)算法;NLG-TTS合成语音的实验试听效果良好.  相似文献   

7.
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升.  相似文献   

8.
本文设计了一个基于格型网络的语音合成算法,采用格型网络输出合成语音,通过对语音参数进行线性内插等措施来提高合成语音的自然度、清晰度。  相似文献   

9.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

10.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

11.
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整,可调范围比较大,而且保证了合成语音的清晰度与自然度,非正式测听结果表明:该算法是一种很符合汉语语音的韵律调整的 算法。  相似文献   

12.
用HD38880语音合成芯片构成的汉语合成器   总被引:1,自引:0,他引:1  
数字语音合成技术作为语音智能的一部分有着广泛的应用前景,它是利用语音的参数模型,从语音信号中提取若干个参数,存放在固定的内存中,再生时用语音合成芯片还原成语音的,我们的工作是将日语专用的语音合成芯片HD38880移植到汉语上来,获得了满意的效果。本文介绍的汉语合成器是用合成芯片 HD38880以及参数EPROM 等少量硬件制成,合成声音清晰自然,且具有体积小結构简单的特点,在仪器仪表语音智能化、计算机自动应答等方面都可以应用。汉语合成器中参数EPROM的制作直接影响合成声音的自然度。文中将对参数EPROM的研制过程,汉语合成器的硬件結构和软件流程作详细描述,同时对其应用实例“报时时钟”作简要介绍。  相似文献   

13.
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低.  相似文献   

14.
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力.  相似文献   

15.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标.  相似文献   

16.
韵律标注是藏语语音合成语料库建设的重要环节.文章参考汉语韵律标注的研究成果,结合藏语自身的语音特点以及韵律特征,进行了面向藏语语音合成语料库的韵律标注研究,并设计一套包含拉丁转写、声调类型、音节结构、重音类型以及停顿指数的标注规则,为藏语语音韵律特征的研究提供了直观的、科学的方法.  相似文献   

17.
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。  相似文献   

18.
采用HTS语音训练合成工具和STRAIGHT语音合成器,尝试在未知某方言(或土语)的实际语音系统的条件下开展相应的语音训练合成工作。采用古音系统来转写汉语字音,并在此基础上设计相应的问题集以实现语音训练合成。设计了一套面向汉语方言语音合成的通用发音文本;录制了一些汉语方言点的合成语音语料库;搭建了基于古音系统的汉语方言语音合成平台。普通话的合成实验结果表明:基于古音系统训练合成出来的语音,在可懂度和音质上跟基于普通话拼音系统训练合成出来的语音非常接近。这表明基于古音系统进行汉语方言语音合成的方法是有效的、可行的。  相似文献   

19.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

20.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号