首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

2.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

3.
以时域基音同步叠加(TD-PSOLA)技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。  相似文献   

4.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

5.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

6.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标.  相似文献   

7.
大学生闽南语说话人识别语音库的设计   总被引:1,自引:0,他引:1  
设计了一个包含120名在校大学生的闽南语说话人识别语音库.该语音库可以根据闽南语口音、说话人性别等条件来进行语音语料的查询.针对不同口音的说话人进行了一系列的GMM(Gaussian Mixture Speaker Model)说话识别实验,验证了特定口音模型比非特定口音模型的识别率一般要高10%左右.  相似文献   

8.
提出一个面向通信系统性能评价的语音库研制方案 ,并给出其基于 MATLAB仿真的实现途径 .语音库通过建立一个通信仿真系统 ,采用系统仿真的方法来实时获取语音资料 .由于对仿真系统的设计是基于通用通信系统的 ,因此可以实现在不同通信环境下对各种通信系统的仿真 ,使仿真既具有灵活性 ,又具有通用性 .语音库只需存储相应的仿真参数而不是通常的实际语音资料 .这种“参数”存储方法 ,极大地减少了存储空间 ,解决了一般语音库占用存储空间过大的问题 .  相似文献   

9.
;耳语音是一种常见的语言交流方式,在医学、公安、司法等领域都发挥了重要的作用,耳语语音库的建立对于研究耳语音的识别是极其重要的.该文介绍了耳语音的特点和现有的耳语音语音库.建立了一个包含同语料耳语音和正常音的语音库,语料主要由数字串构成,同时包括少量连续语句,发音人为10个男生,10个女生.详细介绍了发音人注意事项、语料的选择、系统的构建和语音库的标注等几个问题.后利用采集到的语音库分析验证了耳语音的声学特性.  相似文献   

10.
提出一个面向通信系统性能评价的语音库研制方案,并给出其基于MATLAB仿真的实现途径,语间库通过建立一个通信仿真系统,采用系统仿真的方法来实时获取语音资料。由于对仿真系统的设计是基于通用通信系统的,因此可以实现拓不同通信环境下对各种通信系统的仿真,使仿真既具有灵活性,又具有通用性。语音库只需存储相应的仿真参数而不是通常的实际语音资料。这种“参数”存储方法,极大地减少了存储空间,解决了一般语音库占用  相似文献   

11.
Wang  RenHua  Dai  LiRong  Ling  ZhenHua  Hu  Yu 《科学通报(英文版)》2009,54(11):1963-1969
This paper proposes a trainable unit selection speech synthesis method based on statistical modeling framework. At training stage, acoustic features are extracted from the training database and statistical models are estimated for each feature. During synthesis, the optimal candidate unit sequence is searched out from the database following the maximum likelihood criterion derived from the trained models. Finally, the waveforms of the optimal candidate units are concatenated to produce synthetic speech. Experiment results show that this method can improve the automation of system construction and naturalness of synthetic speech effectively compared with the conventional unit selection synthe- sis method. Furthermore, this paper presents a minimum unit selection error model training criterion according to the characteristics of unit selection speech synthesis and adopts discriminative training for model parameter estimation. This criterion can finally achieve the full automation of system con- struction and improve the naturalness of synthetic speech further.  相似文献   

12.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

13.
近年来,在汉语语音合成的研究中,如何提高合成语音的自然度越来越引起人们的关注。其中的关键问题是设计一个能灵活有效地调节汉语韵律特征的语音合成器。进行韵律调节的基本原理是基于源/滤波器理论,采用同态处理的方法,对汉语文语转换系统进行研究,并对韵律调节部分进行分析和实验。实验结果显示,这种方法要胜于PSOLA方法,下一步,一块基于DSP芯片“TMS320C54x”的PC卡将用来实现上述目标,从而期望建立一个实时的语音合成器,并使其得到广泛的应用。  相似文献   

14.
基于帧间重叠谱减法的语音增强算法及实现   总被引:4,自引:0,他引:4       下载免费PDF全文
采用短时谱分析,合成技术,对含噪语音进行帧间重叠谱减法消除噪音,这种算法符合语音特性连续变化的特点。实验证明,该方法有效去除了噪声干扰,得到了增强语音,保证了话音的可懂度和自然度不受损失。  相似文献   

15.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

16.
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整,可调范围比较大,而且保证了合成语音的清晰度与自然度,非正式测听结果表明:该算法是一种很符合汉语语音的韵律调整的 算法。  相似文献   

17.
拼接代价函数是决定合成音自然度的重要因素之一。针对拼接代价函数,以往的研究只考虑拼接点处的特征向量是否相等,而没涉及到特征向量的一阶连续性。该文研究并实现了以三音子做为基元的朝鲜语文语转换系统,并研究了基元动态特征对拼接的影响,设计了能反映特征连续性的一种新的拼接代价函数,利用两个基元在拼接点处的特征向量及其一阶差分值计算拼接代价。实验结果表明,基于动态特征连续性的拼接代价函数可以较好地改善拼接处的频谱连续性,有效地提高了朝鲜语合成语音的自然度。  相似文献   

18.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号