首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

2.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

3.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标.  相似文献   

4.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

5.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

6.
采用HTS语音训练合成工具和STRAIGHT语音合成器,尝试在未知某方言(或土语)的实际语音系统的条件下开展相应的语音训练合成工作。采用古音系统来转写汉语字音,并在此基础上设计相应的问题集以实现语音训练合成。设计了一套面向汉语方言语音合成的通用发音文本;录制了一些汉语方言点的合成语音语料库;搭建了基于古音系统的汉语方言语音合成平台。普通话的合成实验结果表明:基于古音系统训练合成出来的语音,在可懂度和音质上跟基于普通话拼音系统训练合成出来的语音非常接近。这表明基于古音系统进行汉语方言语音合成的方法是有效的、可行的。  相似文献   

7.
汉语语音合成的研究进展   总被引:2,自引:0,他引:2  
为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上的应用以及目前评价语音合成系统性能的一些新方法,并对当前语音合成技术的研究热点和语音合成技术存在的问题进行了分析,为语音合成技术的进一步研究提供了借鉴作用。  相似文献   

8.
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。  相似文献   

9.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

10.
用HD38880语音合成芯片构成的汉语合成器   总被引:1,自引:0,他引:1  
数字语音合成技术作为语音智能的一部分有着广泛的应用前景,它是利用语音的参数模型,从语音信号中提取若干个参数,存放在固定的内存中,再生时用语音合成芯片还原成语音的,我们的工作是将日语专用的语音合成芯片HD38880移植到汉语上来,获得了满意的效果。本文介绍的汉语合成器是用合成芯片 HD38880以及参数EPROM 等少量硬件制成,合成声音清晰自然,且具有体积小結构简单的特点,在仪器仪表语音智能化、计算机自动应答等方面都可以应用。汉语合成器中参数EPROM的制作直接影响合成声音的自然度。文中将对参数EPROM的研制过程,汉语合成器的硬件結构和软件流程作详细描述,同时对其应用实例“报时时钟”作简要介绍。  相似文献   

11.
汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。  相似文献   

12.
让计算机朗读文章是多媒体技术应用的重要组成部分。在国内外实现高自然度和可懂度的语音合成系统是每一个做语音合成系统的人来说是一理想的目标。维吾尔语文本—基于音素的波形拼接语音合成技术的任务是把维吾尔语文本逐句转化为维吾尔语语音输出,其用处非常广泛。目前比较好的维吾尔语语音合成技术采用以音节为合成单元的合成技术。  相似文献   

13.
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力.  相似文献   

14.
由我校同济大学计算机系承担的国家七五重点科技攻关项目“CSSS-1型汉语语音合成系统,于1990年12月由机电部计算机司主持通过技术鉴定。专家们实地观看了课题成果,全面审查了该课题的技术档案,与会者一致认为: 1.该系统由汉语语音板和系统支持软件两大部件组成,该系统的汉语语音库,语音合  相似文献   

15.
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升.  相似文献   

16.
该文介绍了一个实用的汉语文语转换系统NLG-TTS.该系统的输入为自然汉语文本,对输入文本进行规格化处理和分词处理之后,根据汉语语言学规则对文本进行音位和韵律标注;系统选用汉语有调音节和常用词为语音合成基元,音元数据的压缩选用矢量和激励线性预测(VSELP)算法;NLG-TTS合成语音的实验试听效果良好.  相似文献   

17.
通过对多带激励(multi-band excitation,MBE)语音编码的研究,将自适应谱增强技术应用在多带激励语音编码中,提升了合成语音的清晰度,改善了合成语音的质量;仿真实验表明:自适应谱增强技术使合成语音的基频和二次谐波的谱幅度明显提升,有效地增强了合成语音的清晰度。  相似文献   

18.
讨论了连续汉语语音合成中的问题,介绍了采用线性预测方法,用专用语音合成芯片TMSs220实现实时连续汉语语音合成的原理和方法,同时以11个语音合成试验句和二字词组为例,进行了合成试验,得到了满意的结果。  相似文献   

19.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。  相似文献   

20.
提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号