期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

徐英进王永鑫蔡莲红《中国科技论文在线》2012,(10):783-786

汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。相似文献

2.

基于目标逼近特征和双向联想贮存器的情感语音基频转换

《天津大学学报(自然科学与工程技术版)》2015,(8)

提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力. 相似文献

3.

语音合成中基于听辨指导的权重训练算法 总被引：1，自引：0，他引：1

吴志勇蔡莲红蔡锐《清华大学学报(自然科学版)》2005,45(1):52-56

针对语音合成的基元选取中权重设定的问题提出了一种基于人工听辨指导的权重自动训练的方法。该方法首先通过人工听辨对现有的基元选取结果进行评测打分,然后采取韵律逼近的方法对人工评测的结果进行学习,进而对权重进行调整修正,从而实现权重的自动训练。实验表明:该方法较好地解决了权重设定的问题,使得合成语音的自然度听辨得分由3.49提高到4.02。同时,该方法还使得语音合成系统在使用过程中根据用户反馈自动进行优化成为可能。相似文献

4.

蒙古语语音库中动词词缀分库的建立

包春梅敖其尔马占新阿日木扎《内蒙古大学学报(自然科学版)》2009,40(6)

针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标. 相似文献

5.

汉语文语转换系统NLG-TTS的设计与实现

张岳新许流发《南京理工大学学报(自然科学版)》2000,24(Z1):42-47

该文介绍了一个实用的汉语文语转换系统NLG-TTS.该系统的输入为自然汉语文本,对输入文本进行规格化处理和分词处理之后,根据汉语语言学规则对文本进行音位和韵律标注;系统选用汉语有调音节和常用词为语音合成基元,音元数据的压缩选用矢量和激励线性预测(VSELP)算法;NLG-TTS合成语音的实验试听效果良好. 相似文献

6.

基于情感基音模板的情感语音合成

陈明义党培霞《中南大学学报(自然科学版)》2010,41(6)

为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力. 相似文献

7.

维吾尔语清塞音[q]的声学分析

《西北民族学院学报》2017,(2)

利用"现代维吾尔语语音声学参数库",对维吾尔语清塞音[q]的单音节、双音节、三音节、多音节中男性(M2)和女性(F2)的无声间隙(GAP)、嗓音起始时间(VOT)、时长(CD)、音强(CA)、共振峰(F)等不同音节中的声学特征进行统计和声学分析,找出维吾尔语清塞音[q]在不同音节中的不同声学特征.本研究对维吾尔语教学、语音识别和语音合成有一定的理论基础和应用价值. 相似文献

8.

基于HMM的缅甸语语音合成系统设计与实现

《云南大学学报(自然科学版)》2020,(1)

由于电子化语言资源较为匮乏,缅甸语语音合成的研究相对滞后.针对该问题,以开发缅甸语语音合成应用系统为目的,设计并实现了一个基于HMM的语音合成系统.首先,为了使计算机按输入文本合成出正确的读音,提出并设计了缅甸语的注音方案,其中重点解决了缅甸语中的变音和变调问题;然后,根据缅甸语的语音特点选取声母及带声调的韵母作为合成基元,并按此设计上下文属性和问题集;最后,基于HTS平台,完整实现了音子自动切分、HMM声学模型训练及语音合成.实验结果表明,该缅甸语语音合成系统具有可行性,可作为后续研究的基线系统. 相似文献

9.

基于古音系统的汉语方言语音合成

黄小明熊子瑜《清华大学学报(自然科学版)》2013,(6):771-775

采用HTS语音训练合成工具和STRAIGHT语音合成器,尝试在未知某方言(或土语)的实际语音系统的条件下开展相应的语音训练合成工作。采用古音系统来转写汉语字音,并在此基础上设计相应的问题集以实现语音训练合成。设计了一套面向汉语方言语音合成的通用发音文本;录制了一些汉语方言点的合成语音语料库;搭建了基于古音系统的汉语方言语音合成平台。普通话的合成实验结果表明:基于古音系统训练合成出来的语音,在可懂度和音质上跟基于普通话拼音系统训练合成出来的语音非常接近。这表明基于古音系统进行汉语方言语音合成的方法是有效的、可行的。相似文献

10.

基于说话人自适应训练的汉藏双语语音合成

王海燕杨鸿武甘振业裴东《清华大学学报(自然科学版)》2013,(6):776-780

根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。相似文献

11.

Modeling Pitch Contour of Chinese Mandarin Sentences with the PENTA Model

《清华大学学报》2012,(2):218-224

In continuous speech,the pitch contour of the same syllable may vary much due to its contextual information.The Parallel Encoding and Target Approximation (PENTA) model is applied here to Mandarin speech synthesis with a method to predict pitch contours for Chinese syllables with different contexts by combining the Classification And Regression Tree (CART) with the PENTA model to improve its prediction accuracy.CART was first used to cluster the syllables’ normalized pitch contours according to the syllables contextual information and the distances between pitch contours.The average pitch contour was used to train the PENTA model with the average contour for each cluster.The initial pitch is required with the PENTA model to predict a continuous pitch contour.A Pitch Discontinuity Model (PDM) was used to predict the initial pitches at positions with voiceless consonants and prosodic boundaries.Initial tests on a Chinese four-syllable word corpus containing 2048 words were extended to tests with a continuous speech corpus containing 5445 sentences.The results are satisfactory in terms of the Root Mean Square Error (RMSE) comparing the predicted pitch contour with the original contour.This method can model pitch contours for Mandarin sentences with any text for speech synthesis. 相似文献

12.

改进的HMM系统在英语语音合成中的研究

张雪英陈洁孙颖《太原理工大学学报》2012,43(1):16-19

根据英语语言所具有的一些特性对HMM模型进行改进,设计出适合英语语音合成的上下文属性集以及用于模型聚类的问题集,提高了其建模和训练效果。此外,借助HTK和Festival等工具,以基频和声道谱参数为训练参数,最终实现此英语语音合成系统。从所合成语句的效果来看,合成语音整体稳定流畅,而且节奏感比较强。相似文献

13.

Trainable unit selection speech synthesis under statistical framework

Wang RenHua Dai LiRong Ling ZhenHua Hu Yu 《科学通报(英文版)》2009,54(11):1963-1969

This paper proposes a trainable unit selection speech synthesis method based on statistical modeling framework. At training stage, acoustic features are extracted from the training database and statistical models are estimated for each feature. During synthesis, the optimal candidate unit sequence is searched out from the database following the maximum likelihood criterion derived from the trained models. Finally, the waveforms of the optimal candidate units are concatenated to produce synthetic speech. Experiment results show that this method can improve the automation of system construction and naturalness of synthetic speech effectively compared with the conventional unit selection synthe- sis method. Furthermore, this paper presents a minimum unit selection error model training criterion according to the characteristics of unit selection speech synthesis and adopts discriminative training for model parameter estimation. This criterion can finally achieve the full automation of system con- struction and improve the naturalness of synthetic speech further. 相似文献

14.

一种无阈值的傅里叶窗口滤波算法

李兴龙冷海旭孙平《山东师范大学学报(自然科学版)》2013,(3):66-70

提出了一种无需设定阈值的傅里叶窗口滤波算法,该方法解决了加窗傅里叶变换法无法克服的阈值问题,得到单一最佳频率图像,并大大缩短了计算时间．该方法可用于各类条纹图像的低通滤波,为从条纹图中进一步提取变形相位奠定了良好的基础．笔者介绍了自动窗口傅里叶变换算法的原理,利用该算法对散斑图进行了处理,并与加窗傅里叶变换法的滤波结果进行了对比．实验结果证明了无需设定阈值的傅里叶窗口滤波算法具有良好的滤波效果．相似文献

15.

利用说话人自适应实现基于DNN的情感语音合成

智鹏鹏杨鸿武宋南《重庆邮电大学学报(自然科学版)》2018,30(5):673-679

为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。相似文献

16.

电站频载调节的模糊控制

张维胡家耀《北京工商大学学报(自然科学版)》1994,(2)

通过对柴油发电机组有功功率和频率变化特性的分析表明，采用常规控制方法解决非线性、非实时性数学模型存在一些问题，本文提出了一种基于模糊数学的算法──模糊控制，采用语言变量来描述系统，可得到一套控制规则，能很好地解决频载调节过程中频率和有功功率的耦合问题。文中给出了一个具体的ＦＵＺＺＹ控制器的设计方案。相似文献

17.

语音情感特征提取和识别的研究与实现 总被引：9，自引：0，他引：9

詹永照曹鹏《江苏大学学报(自然科学版)》2005,26(1):72-75

针对语音情感识别的实时性与可用性问题,提出了利用汉明窗提取语音信号中情感特征的方法,从说话者中采集带有快乐、愤怒、惊奇、悲伤情感的语句,并从语句中提取8个情感特征参数．同时提出采用贡献分析法确定情感特征参数的权值,利用加权欧氏距离模板匹配识别语音情感．实验表明该方法识别率有提高,更适合实时识别的应用。相似文献

18.

评定计算机考试成绩的Fuzzy数学模型 总被引：1，自引：0，他引：1

邹豪思《内蒙古大学学报(自然科学版)》2004,35(6):628-631

用模糊数学的理论和方法建立多层次Fuzzy综合评判模型．给出评定计算机考试题库建立的评判因素和权重，并确定模糊综合评判矩阵，既可分析出学生在各个单元的学习情况，又可分析出整体的学习状况．相似文献

19.

基于特征融合的中文文本情感分析方法

赵宏傅兆阳王乐《兰州理工大学学报》2022,48(3):94

针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率. 相似文献