首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

2.
汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。  相似文献   

3.
根据英语语言所具有的一些特性对HMM模型进行改进,设计出适合英语语音合成的上下文属性集以及用于模型聚类的问题集,提高了其建模和训练效果。此外,借助HTK和Festival等工具,以基频和声道谱参数为训练参数,最终实现此英语语音合成系统。从所合成语句的效果来看,合成语音整体稳定流畅,而且节奏感比较强。  相似文献   

4.
采用HTS语音训练合成工具和STRAIGHT语音合成器,尝试在未知某方言(或土语)的实际语音系统的条件下开展相应的语音训练合成工作。采用古音系统来转写汉语字音,并在此基础上设计相应的问题集以实现语音训练合成。设计了一套面向汉语方言语音合成的通用发音文本;录制了一些汉语方言点的合成语音语料库;搭建了基于古音系统的汉语方言语音合成平台。普通话的合成实验结果表明:基于古音系统训练合成出来的语音,在可懂度和音质上跟基于普通话拼音系统训练合成出来的语音非常接近。这表明基于古音系统进行汉语方言语音合成的方法是有效的、可行的。  相似文献   

5.
综述了语音合成技术的发展现状.指出并分析了目前系统存在的发音质量、韵律预测、表现能力等3个方面的问题.提出了将语义分析引入语音合成系统,使合成语音具有准确、生动的语义表现能力,并作为新一代语音合成系统的目标.探讨了实现这一目标所涉及的理论基础、技术实现、基础资源等研究内容.  相似文献   

6.
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升.  相似文献   

7.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标.  相似文献   

8.
研究了语音合成芯片TSP5220的合成原理及使用方法,设计并实现了由IBM/PC机及TSP5220组成的语音合成系统。该系统合成的语音具有较好的可懂性和自然度,且速率仅为1~1.7kb/s,与64kb/sPCM相比较,大大降低了存储语音所需的容量  相似文献   

9.
在蒙古语语音合成系统中,语料库的好坏会直接影响语音合成的效果.因此,语料库标注规则的设计对语音合成工作具有重要意义.提出了一种新的蒙古语语音合成语料库的标注规则,并用按此规则标注的蒙古语语料库进行了基于隐马尔科夫模型的蒙古语语音合成实验,合成效果达到了预期目标,说明我们提出的标注规则是合理可靠的.  相似文献   

10.
提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力.  相似文献   

11.
汉语语音合成的研究进展   总被引:2,自引:0,他引:2  
为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上的应用以及目前评价语音合成系统性能的一些新方法,并对当前语音合成技术的研究热点和语音合成技术存在的问题进行了分析,为语音合成技术的进一步研究提供了借鉴作用。  相似文献   

12.
为提高语音合成系统的性能,产生自然流畅的合成语音,该文结合多种拼接点过渡平滑算法,提出了一种以语境相关的音素为基本单元的基于隐Markov(hidden Markov model,HMM)模型的英语拼接合成系统.该合成方法兼有拼接合成以及参数合成的优点,具有相对的灵活性,以及一定的语音自然度.以音素为基本单元尽可能减少了拼接点的个数,降低拼接失真.实验结果表明,多种平滑算法的采用,保证了拼接边界过渡平滑连贯,提高了最终的拼接效果.  相似文献   

13.
纳西语语音合成的初步研究   总被引:1,自引:0,他引:1  
本文初步建立了一个纳西语按规则语音合成系统,该系统采用共振峰语音合成技术,以350个左右的无调单音节和4种声调模式为合成基元,该系统不仅适用于纳西语文-语转换系统,而且也是一个研究纳西语语音的有力工具。  相似文献   

14.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

15.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

16.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

17.
本文介绍了基于波形语音合成了中,用于改善合成语音自然度的PSOLA算法的一般过程,及该算法在实现各文--语转换系统中的应用情况;介绍了法国的使用同一个基于PSOLA垢语音合成器,而实现的CNET多语种混合输入TTS系统的情况,讨论了一般的TTS系统对混合输入的处理模型。  相似文献   

18.
采用按需分段合成的策略,即服务器每次只合成一小段文本给客户端使用,当客户端播放语音数据时服务器再合成另一小段文本,以提高在单机情况下系统支持的并发线路数;再根据负载均衡的原理使用多台计算机并行处理文语转换运算.对语音合成服务器的性能测试结果表明,采用按需分段合成策略和负载均衡的设计可提升文语转换系统所能达到的规模,并能够满足系统的实时性、并发性、稳定性和系统无级扩容的要求.  相似文献   

19.
文章根据藏语的语音规律和特点,以统计声学模型为基础,对藏语语音合成系统中的语料库设计与建设、韵律信息及标注、模型设计与训练及语音合成等关键技术进行了分析,对藏语语音合成系统的实现具有一定的参考价值。  相似文献   

20.
介绍了一个基于电话和Internet的限定领域的口语问答对话系统,该系统为出行者提供上海市任意两地间的最佳的出行路线.系统集成了语音识别、自然语言理解、语音合成以及对话管理技术;在语言理解中采用了部分句法分析,系统的实现通过对话管理中情景语义框架的定义和容错控制的设计来完成.文中还介绍了系统的构成,重点分析了语言理解和对话管理的设计,并对系统效率和理解能力作了评测.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号