共查询到18条相似文献,搜索用时 125 毫秒
1.
雷冠军 《江南大学学报(自然科学版)》2010,9(6)
采用传统激励模型的基于HMM的文语转换系统的合成语音自然度不高,主要原因是其采用的激励模型用脉冲串作为浊音段激励和白噪声作为清音段激励过于粗糙,不能很好地模拟自然语音的激励.借鉴MELP语音编码算法,把混合激励模型应用到系统中,对合成语音激励信号进行改进.试验结果表明,混合激励模型大大提高了系统的自然度. 相似文献
2.
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升. 相似文献
3.
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.对于韵律的研究是语音合成技术中的重要研究课题.通过介绍语音韵律控制技术及其在TTS中应用的一些情况,内容包括语音韵律研究的基本情况及今后的工作重点,语音合成技术中韵律调整的方法,以及TTS中的韵律生成模型和声学模块. 相似文献
4.
语音合成中基于听辨指导的权重训练算法 总被引:1,自引:0,他引:1
针对语音合成的基元选取中权重设定的问题提出了一种基于人工听辨指导的权重自动训练的方法。该方法首先通过人工听辨对现有的基元选取结果进行评测打分,然后采取韵律逼近的方法对人工评测的结果进行学习,进而对权重进行调整修正,从而实现权重的自动训练。实验表明:该方法较好地解决了权重设定的问题,使得合成语音的自然度听辨得分由3.49提高到4.02。同时,该方法还使得语音合成系统在使用过程中根据用户反馈自动进行优化成为可能。 相似文献
5.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。 相似文献
6.
7.
利用可穿戴式加速度传感器采集手势动作信息,研究了基于隐马尔可夫模型的手势识别技术.首先采集手势加速度数据,采用改进的SWAB算法进行自动端点检测,通过提取相应的手势特征,利用HMM对手势指令建模,并采用K-means算法矢量量化手势特征序列,以提高手势识别性能.实验表明,本文采用的方法能够有效识别手势动作. 相似文献
8.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。 相似文献
9.
基于自评估HMM的离心泵状态识别方法研究 总被引:1,自引:0,他引:1
由于HMM本身的特点,在实际应用中如何找到一个合适的HMM模型始终是一个难点.采用传统的Baum-W elch算法对HMM进行训练,并提出了一种对训练结果进行评估的方法,构建了可自动评估的HMM训练体系. 相似文献
10.
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。 相似文献
11.
根据英语语言所具有的一些特性对HMM模型进行改进,设计出适合英语语音合成的上下文属性集以及用于模型聚类的问题集,提高了其建模和训练效果。此外,借助HTK和Festival等工具,以基频和声道谱参数为训练参数,最终实现此英语语音合成系统。从所合成语句的效果来看,合成语音整体稳定流畅,而且节奏感比较强。 相似文献
12.
姚萝姑 《上海交通大学学报》1996,30(6):141-146
介绍了一个在微机上实现的有限词,特定人语音识别系统,该系统采用连续,M元高斯混合密度的隐式马尔柯夫模型(CDHMM)为识别方法,以修改后的BaumWelch方法为训练重估算法,文中提出了对语音特征矢量非线性归一化预处理,和对训练数据不足的HMM模型特征空产是进行后处理修正的算法,还提出了一种基于语音知识的模型初始化的方法,经实验证明,系统的识别率可以达到90%以上。 相似文献
13.
文章研究了两种不同语音识别算法—动态时间伸缩算法(DTW)和隐马尔可夫模型(HMM),并在模式匹配原理的基础上,设计、实现了在Matlab环境中,应用DTW识别法及HMM识别法的孤立字语音识别实验平台。 相似文献
14.
基于离散隐马尔科夫模型的语音识别技术 总被引:1,自引:0,他引:1
概述语音识别技术的基本原理,对当前三种主要识别技术--动态时间规整技术、隐含马尔科夫模型技术及人工神经网络技术进行比较,重点介绍基于离散隐马尔科夫模型(DHMM)的语音识别系统的实现. 相似文献
15.
基于ZCPA和DHMM的孤立词语音识别系统 总被引:2,自引:0,他引:2
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统的过程,重点针对软件实现中的问题重新推导了Baum Welch算法的重估公式,引入一种抗噪性能很好的特征参数:过零率与峰值幅度特征,将该特征与DHMM结合用于孤立词识别系统。结果表明,此系统训练时收敛很快并且识别效果好。 相似文献
16.
17.
噪声环境中基于HMM模型的语音信号端点检测方法 总被引:8,自引:1,他引:8
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的. 相似文献
18.
为了降低基于CSMA的频谱接入技术在利用频谱空洞时授权用户和认知用户之间发生冲突的概率,提出了一种基于HMM的动态频谱接入方法。利用HMM预测频谱的状态信息,使认知用户在发现授权用户开始传送数据前退出所占用的频带,避免与授权用户产生冲突,根据预测的信息并利用NC-OFDM调制技术传送数据。仿真结果表明,采用该方法的动态频谱接入系统可以大大地降低用户冲突发生的概率,具有比CSMA系统更好的误码性能。 相似文献