期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

皮丹艾合买提·帕尔哈提木尼拉·吐尔洪《科技资讯》2011,(3):5-5

让计算机朗读文章是多媒体技术应用的重要组成部分。在国内外实现高自然度和可懂度的语音合成系统是每一个做语音合成系统的人来说是一理想的目标。维吾尔语文本—基于音素的波形拼接语音合成技术的任务是把维吾尔语文本逐句转化为维吾尔语语音输出,其用处非常广泛。目前比较好的维吾尔语语音合成技术采用以音节为合成单元的合成技术。相似文献

2.

语境相关的音素级语音合成系统中拼接平滑算法

尹勇曹振海祖漪清《清华大学学报(自然科学版)》2008,48(Z1):640-644

为提高语音合成系统的性能,产生自然流畅的合成语音,该文结合多种拼接点过渡平滑算法,提出了一种以语境相关的音素为基本单元的基于隐Markov(hidden Markov model,HMM)模型的英语拼接合成系统.该合成方法兼有拼接合成以及参数合成的优点,具有相对的灵活性,以及一定的语音自然度.以音素为基本单元尽可能减少了拼接点的个数,降低拼接失真.实验结果表明,多种平滑算法的采用,保证了拼接边界过渡平滑连贯,提高了最终的拼接效果. 相似文献

3.

蒙古语语音库中动词词缀分库的建立

包春梅敖其尔马占新阿日木扎《内蒙古大学学报(自然科学版)》2009,40(6)

针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标. 相似文献

4.

基于共振峰过渡的协同发音语音合成算法

康广玉郭世泽孙圣和《天津大学学报(自然科学与工程技术版)》2010,43(9)

协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低. 相似文献

5.

基于语音合成法的汉语人名语音库的设计应用

王秀君和应民《应用科技》2006,33(3):10-12

采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中. 相似文献

6.

基于PSOLA算法的语音编码压缩的研究与实现

曹钢徐宏炳《东南大学学报(自然科学版)》2001,31(4):36-39

以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 . 相似文献

7.

在于PSOLA算法的语音编码压缩的研究与实现

曹钢徐宏炳《东南大学学报(自然科学版)》2001,31(4):36-39

以时域基音同步叠加（TD－PSOLA）技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。相似文献

8.

基于基音同步叠加的汉语文语转换

霍华普杰信刘俊强冯阳春王平《河南科技大学学报(自然科学版)》2001,22(4):38-42

提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求相似文献

9.

基于声学统计建模的新一代语音合成技术

王仁华 DAI Li-rong 胡郁 LING Zhen-hua 《中国科学技术大学学报》2008,38(7)

介绍基于声学统计建模的新一代语音合成技术．重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括：融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足．这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升．相似文献

10.

基于情感基音模板的情感语音合成

陈明义党培霞《中南大学学报(自然科学版)》2010,41(6)

为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力. 相似文献

11.

Trainable unit selection speech synthesis under statistical framework

Wang RenHua Dai LiRong Ling ZhenHua Hu Yu 《科学通报(英文版)》2009,54(11):1963-1969

This paper proposes a trainable unit selection speech synthesis method based on statistical modeling framework. At training stage, acoustic features are extracted from the training database and statistical models are estimated for each feature. During synthesis, the optimal candidate unit sequence is searched out from the database following the maximum likelihood criterion derived from the trained models. Finally, the waveforms of the optimal candidate units are concatenated to produce synthetic speech. Experiment results show that this method can improve the automation of system construction and naturalness of synthetic speech effectively compared with the conventional unit selection synthe- sis method. Furthermore, this paper presents a minimum unit selection error model training criterion according to the characteristics of unit selection speech synthesis and adopts discriminative training for model parameter estimation. This criterion can finally achieve the full automation of system con- struction and improve the naturalness of synthetic speech further. 相似文献

12.

一个基于正弦模型的音乐合成系统

吴耀中秦晓东《福建师范大学学报(自然科学版)》2000,16(1):31-33

利用正弦模型设计一个音乐合成系统 .由于正弦模型具有高效性和灵活性 ,它能够修改合成单元的基音频率、时长等 ,因此本合成系统利用波型拼接的方法来合成音乐 .合成系统中的合成单元由专业歌手发音来形成相似文献

13.

蒙古语文语转换系统的研究与实现

何敏高光来赵斯琴《内蒙古大学学报(自然科学版)》2004,35(1):100-104

介绍了一个基于PSOLA合成技术的蒙古语文语转换系统，系统针对蒙古语自身的特点，采用了语音合成领域比较成熟的波形编辑合成技术，也建立了实用的蒙古语语音合成音库，音库基元都进行了基音标记，在韵律修改中也做了尝试。相似文献

14.

基于三维可视语音库的发音康复方法

赵剑王丽荣《长春大学学报》2010,(2):75-77

将语音合成领域中研究的可视语音技术应用于康复工程之中,设计了一个基于三维视觉的语音库系统。提出了基于三维语音库的语音辅助系统应用于聋儿语言发音训练的新方法,通过直观的视觉反馈对聋而不哑的听障儿童进行发音训练,从而改善他们的发音质量。提出该方法的框架结构,系统能够培养聋儿语感及自主学习语言的意识,使其具有一定的说话能力,为其今后的知识学习和参与社会活动奠定基础。相似文献

15.

朝鲜语文语转换及其拼接代价的研究

李光虎蔡莲红《清华大学学报(自然科学版)》2006,46(4):596-599

拼接代价函数是决定合成音自然度的重要因素之一。针对拼接代价函数,以往的研究只考虑拼接点处的特征向量是否相等,而没涉及到特征向量的一阶连续性。该文研究并实现了以三音子做为基元的朝鲜语文语转换系统,并研究了基元动态特征对拼接的影响,设计了能反映特征连续性的一种新的拼接代价函数,利用两个基元在拼接点处的特征向量及其一阶差分值计算拼接代价。实验结果表明,基于动态特征连续性的拼接代价函数可以较好地改善拼接处的频谱连续性,有效地提高了朝鲜语合成语音的自然度。相似文献

16.

TTS系统对混合输入的处理方法

涂相化《信阳师范学院学报(自然科学版)》1996,9(4):389-392

本文介绍了基于波形语音合成了中，用于改善合成语音自然度的ＰＳＯＬＡ算法的一般过程，及该算法在实现各文－－语转换系统中的应用情况；介绍了法国的使用同一个基于ＰＳＯＬＡ垢语音合成器，而实现的ＣＮＥＴ多语种混合输入ＴＴＳ系统的情况，讨论了一般的ＴＴＳ系统对混合输入的处理模型。相似文献

17.

安多藏语语音合成语料库的设计

李永宏于洪志《西北民族学院学报》2006,27(1):36-39

藏语语音合成语料数据库的优劣对合成语音质量有很大的影响,语料的设计考虑了音段和韵律,语料库中包含藏语的音节、词语、独白语句和情景对话语等. 相似文献

18.

基于正弦表示与耳蜗模型的语音分析与合成

袁京贤万旺根《上海大学学报(自然科学版)》1998,4(5):520-526

本文采用语音信号的正弦表示方法并利用耳蜗模型提取了语音信号的基本物征参数，建立了一个语音分析／合成系统。相似文献

19.

语音驱动的唇型合成系统的实现

丁丽娟王晓曦杨阳蕊于洪志《长春工程学院学报(自然科学版)》2010,11(2):109-112

通过对语音和唇形的信号采集,设计了12个外唇线关键点和9个内唇线关键点的提取方案,同时建立起语音、唇形数据库,并对其进行参数提取和统计分析,从而建立了汉语普通话语音、唇型之间的关联模型,在此基础上实现了语音驱动的唇形合成系统. 相似文献