首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
提出了一种新的基于支持向量回归(SVR)的情感语音的变换方法.通过提取普通话10种情感语音的韵律特征,对比分析了中性语音和情感语音之间的韵律特征差异,利用SVR建立了基频、时长、能量、停顿等韵律特征参数的预测模型,并利用Straight算法实现了由中性语音向情感语音的转换.利用这种方法变换出的10种情感语音,其情感主观平均(EMOS)得分为3.4.  相似文献   

2.
提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力.  相似文献   

3.
汉语语音的声调是个人语气与情感状态最直接的表达,是体现汉语语言状态最重要的特征之一。为了使得语音合成的逼真度得到有效的提高,讲话者的话语更加具有区分度,通过加入声调参数特征实现语音语调变换,以期成为情感识别和语音识别的准确度最有力的助推剂,弥补语音合成结果在情感特征以及语音演唱方面的不足。分别对汉语阴平、阳平、上声、去声采用基频提取的方式进行声调的分析、研究,将得到的基频曲线采用多项式函数拟合的方法对汉语4种声调进行重新构建,从数学角度对汉语声调进行分析、重构,采用三角函数曲线模拟随时间变化的语音基频曲线,根据共振峰频率将曲线进行叠加,达到了95.91%的满意的识别结果。结果表明:采用多项式函数拟合方法实现汉语4种声调的语音合成,更好地还原了语音的数学本质,使得抽象化的语音表现得更直观可控。  相似文献   

4.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

5.
选取三种典型的情感状态,通过对在不同情感状态下大量取样的语音样本的基频、能量、时长及相关韵律特征参数作统计分析,基于统计结果使用PCA方法进行情感状态识别实验,识别准确率达91.67%.结合情感识别结果,使用DTW算法通过模式匹配进行小词汇表的语音识别,提高语音识别正确率;给出输出语音韵律特征参数的调整方法,使人机语音交互得到更加人性化的改进.  相似文献   

6.
文章采用实验语音学研究方法,把两首不同题材的蒙古长调作为研究对象,通过对长调歌唱语音信号的采集,分别提取基频、能量、共振峰和时长等参数,对两首长调进行声学参数层面的对比分析.不同题材长调在歌唱时声学参数存在差异,主要表现在能量和基频参数方面,牧歌能量和基频均大于赞歌,从而表现出牧歌悠扬嘹亮的声学特质,充分说明了共振峰参数反映歌手的歌唱水平,而题材差异集中在能量和基频方面.  相似文献   

7.
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整,可调范围比较大,而且保证了合成语音的清晰度与自然度,非正式测听结果表明:该算法是一种很符合汉语语音的韵律调整的 算法。  相似文献   

8.
对维吾尔语的韵律结构进行了全面的研究,从维吾尔语语音合成(text to speech,TTS)语音库中提取了音节的时长、能量、基频均值、最大值、最小值和基频范围等韵律特征参数,分析了其在音节处于不同韵律层次时的变化规律。提取了语音数据中韵律边界前后的音节延长量、音高重置和无声段等声学特征参数,并对它们的分布规律进行了统计分析。实验结果表明:不同韵律层级之间时长延长量和音高差值随着边界层级的提高而增加;韵律词边界之间没有显著地停顿,韵律短语和语调短语层级边界之间的平均停顿时长分别是154.2和212.8ms。  相似文献   

9.
基于韵律语段的语音情感识别方法研究   总被引:2,自引:0,他引:2  
语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。  相似文献   

10.
提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性.  相似文献   

11.
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力.  相似文献   

12.
基于正弦模型的汉语语音时长和音高的修正周江扬 ,柴佩琪  把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整 ,可调范围比较大 ,而且保证了合成语音的清晰度与自然度 .非正式测听结果表明 :该算法是一种很适合汉语语音韵律调整的算法 .飞机荷载作用下场道地基附加应力特征呙润华 ,凌建明  运用弹性层状体系理论 ,编制有限元计算程序 ,对民用机场飞机荷载作用下场道地基顶面及地基内不同深度处的附加应力进行了计算 .给出了飞机荷载作用下地基顶面附加应力的平面分布规律以及附加应力随深度方向的变化特点 .…  相似文献   

13.
汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。  相似文献   

14.
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。  相似文献   

15.
为使得合成系统所生成的语音更加自然,构楚了一个普通话对话语气韵律模型.借鉴现有陈述语气韵律模型的研究成果,针对对话语气的特点进行扩展,生成具有对话语气韵律特征的基频曲线.与陈述语气相比,对话语气具有较快的语速和较窄的调域,然而仅通过变换语速和调域却无法模拟出对话语气的特征.对话语气中音节内部基频曲线无法完成其原先固有的调形,这种现象称为"未完成现象".为了模拟这种现象,利用分类树预测一个音节是正常音节还是未完成音节,并在基频曲线生成模型中对未完成音节进行特殊处理,使之生成具有对话语气韵律特征的基频曲线.听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化.  相似文献   

16.
通过采集甘肃临夏地区"花儿"《白牡丹令》的山野辽阔唱法、哭腔唱法以及超欢快唱法的语音信号,运用实验语音学分析方法,进行了信号的标注和参数的提取.文章通过基频参数、能量参数以及共振峰来分析临夏花儿的基本语音特征及韵律特征,得出三种唱法的整体基频是依次下降的.从能量方面相比,哭腔唱法和超欢快唱法两个能量分布较为相近,且与山野辽阔唱法能量分布相差较大,三种唱法的基频与能量成正相关.  相似文献   

17.
通过采集蒙古族长调《圣主的两匹骏马》的语音信号,运用实验语音声学分析方法,进行了信号标注和参数提取.文章是通过基频和能量参数来分析长调节拍的基本韵律特征,分析歌唱共振峰和颤音的声学表现,探讨其发音原理和演唱技巧,以数字化方式更为深入和直观地研究蒙古族长调的风格特色.  相似文献   

18.
设计了一种语音转歌声的合成器.在给定一段朗读的歌词语音文件和乐谱的信息条件下,合成器系统按照传递函数调整说话人语音的3个声学参数:基频、语音时长和频谱包络.为了构造传递函数,本文使用机器学习的方法研究了歌声的基频和频谱包络.系统选择最小二乘法去学习歌声基频中颤音的参数,用来生成歌声带有颤音的基频;利用高斯混合模型(Gaussian Mixture Model,GMM)学习歌声频谱包络和说话人频谱包络的映射关系,将说话声音的频谱包络转换为音乐带有特定共振峰的频谱包络;根据节拍信息来修改说话语音时长.最终得到的3个参数可以合成音乐歌声,实现机器学习下的语音转歌声.实验结果表明,该合成器能够将说话声音转换为较好的歌声.  相似文献   

19.
针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征集合。然后将声学特征组合与情感语音PAD数据相结合,分两步逐级地判断出输入语音所属的情感类型。该方法在TYUT2.0情感语音数据库上得到了较好的结果,情感分类识别率相较于传统声学特征的分类识别率提高了15.4%.  相似文献   

20.
基于语音声学特征的情感信息识别   总被引:10,自引:0,他引:10  
为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m arkov m ode l)分别对声学参数的统计特征和时序特征进行处理。计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果。实验结果表明:各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%。这说明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号