首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 221 毫秒
1.
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升.  相似文献   

2.
近年来,在汉语语音合成的研究中,如何提高合成语音的自然度越来越引起人们的关注。其中的关键问题是设计一个能灵活有效地调节汉语韵律特征的语音合成器。进行韵律调节的基本原理是基于源/滤波器理论,采用同态处理的方法,对汉语文语转换系统进行研究,并对韵律调节部分进行分析和实验。实验结果显示,这种方法要胜于PSOLA方法,下一步,一块基于DSP芯片“TMS320C54x”的PC卡将用来实现上述目标,从而期望建立一个实时的语音合成器,并使其得到广泛的应用。  相似文献   

3.
采用HTS语音训练合成工具和STRAIGHT语音合成器,尝试在未知某方言(或土语)的实际语音系统的条件下开展相应的语音训练合成工作。采用古音系统来转写汉语字音,并在此基础上设计相应的问题集以实现语音训练合成。设计了一套面向汉语方言语音合成的通用发音文本;录制了一些汉语方言点的合成语音语料库;搭建了基于古音系统的汉语方言语音合成平台。普通话的合成实验结果表明:基于古音系统训练合成出来的语音,在可懂度和音质上跟基于普通话拼音系统训练合成出来的语音非常接近。这表明基于古音系统进行汉语方言语音合成的方法是有效的、可行的。  相似文献   

4.
汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。  相似文献   

5.
本文探讨了一种汉语情感语音合成的方案。首先,根据汉语韵律的分层特点,采用SFC基频时长韵律模型,从语料库中提取出反映汉语情感特征的基频参数和时长参数曲线;然后,采用STRAIGHT语音分析与合成算法,用提取出的反映情感特征的韵律参数控制合成过程.从而合成出带有情感的汉语语音。  相似文献   

6.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

7.
讨论了连续汉语语音合成中的问题,介绍了采用线性预测方法,用专用语音合成芯片TMSs220实现实时连续汉语语音合成的原理和方法,同时以11个语音合成试验句和二字词组为例,进行了合成试验,得到了满意的结果。  相似文献   

8.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

9.
以时域基音同步叠加(TD-PSOLA)技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。  相似文献   

10.
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低.  相似文献   

11.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标.  相似文献   

12.
设计开发了一种新型电话自动语音报警装置,提出利用EPROM和少量通用数字集成电路.通过硬逻辑实现电话报警触发、自动摘(挂)机、自动拨号、自动提取报警语音信息和自动停机的功能,旨在利用较为简单的设计平台,通过多种手段集成,以实现智能化、多功能的目的。  相似文献   

13.
用最新的语音数字信号处理器、常用单片机、大容量快速闪烁存储卡和编解码器,设计了一个数字语音记录设备。它记录时间长、话音 自然度和可懂度好,具有较高的性能价格比。  相似文献   

14.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

15.
随着语音合成技术的飞速发展 ,设计低价格的语音合成装置已迫在眉睫 ,因此本文设计了以语音合成处理器为核心芯片的语音应答系统 ,我们利用线性预测编码技术把数字信息变成语音输出 ,获得了满意的效果。该系统标志着数字语音技术已经走出了研究实验室 ,它为计算机语音指令系统的研究提供了实验依据。  相似文献   

16.
多路远程语音传真监控系统   总被引:1,自引:0,他引:1  
研制一种先进的多路语音传真监控系统,系统采用先进的声码器对语音进行压缩和合成,同时采用时分复用技术和现代数字通讯技术,通过1根电话线实时传输4路高话音质量的语音,从而以最少的信道资源实现远程的、一点对多点的监控。系统还能远程记录传真信号及主/被叫号码等信息,该系统通过试用,效果令用户满意,目前已投入使用。  相似文献   

17.
A kind of Web voice browser based on improved synchronous linear predictive coding (ISLPC) and Text-toSpeech (TTS) algorithm and Internet application was proposed. The paper analyzes the features of TTS system with ISLPC speech synthesis and discusses the design and implementation of ISLPC TTS-based Web voice browser. The browser integrates Web technology, Chinese information processing, artificial intelligence and the key technology of Chinese ISLPC speech synthesis. It's a visual and audible web browser that can improve information precision for network users. The evaluation results show that ISLPC-based TTS model has a better performance than other browsers in voice quality and capability of identifying Chinese characters.  相似文献   

18.
声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。  相似文献   

19.
基于语音信号的发音器官运动估计,是根据说话人语音推断发音器官运动过程的技术,在语言学、医学、影视动画学等领域有广阔应用前景.本文主要对基于单元选择模型和回归模型实现该技术的方法进行介绍.单元选择模型法部分阐述了码本库建设、语音单元切分、选择算法设计、拼接合成算法等方面的研究现状.回归模型法部分阐述了此类问题中隐马尔科夫模型、高斯混合模型、人工神经网络等回归算法的研究现状.最后,文章进行了总结和展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号