首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
韵律标注是藏语语音合成语料库建设的重要环节.文章参考汉语韵律标注的研究成果,结合藏语自身的语音特点以及韵律特征,进行了面向藏语语音合成语料库的韵律标注研究,并设计一套包含拉丁转写、声调类型、音节结构、重音类型以及停顿指数的标注规则,为藏语语音韵律特征的研究提供了直观的、科学的方法.  相似文献   

2.
藏语语音合成语料数据库的优劣对合成语音质量有很大的影响,语料的设计考虑了音段和韵律,语料库中包含藏语的音节、词语、独白语句和情景对话语等.  相似文献   

3.
文章根据藏语的语音规律和特点,以统计声学模型为基础,对藏语语音合成系统中的语料库设计与建设、韵律信息及标注、模型设计与训练及语音合成等关键技术进行了分析,对藏语语音合成系统的实现具有一定的参考价值。  相似文献   

4.
藏语语音合成中语料数据标注规则的设计   总被引:1,自引:0,他引:1  
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。  相似文献   

5.
文章就语音增强的发展历程以及面向藏语语音的研究现状和语音特征作了介绍和分析,并选择藏语拉萨话作为语音增强实验的语种.文章选择经典的谱减法作为语音增强方法,并介绍了谱减法原理,同时设计实验方案,实验语料使用纯净语音和噪音混合成的带噪语音,按照不同信噪比进行语音测试,得到了大量数据结果.在分析结果的基础上得出结论:使用谱减法能够明显提升语音质量,提升效果随着噪音语音相关度的多少而变化.  相似文献   

6.
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.  相似文献   

7.
规范的重音标注将对重音研究和语音合成技术产生积极影响。该文通过对大规模语料进行语流中词重音和句重音标注,总结出了重音标注的规则。重音标注包括标注训练、正式标注、语料库建立3个步骤。通过标注训练明确重音概念和标注方法,词重音采取词内对比法,所谓"重"主要指突显度和饱满度;句重音采取呼吸句群单位标注法,注重标注的层级性,不跨句群进行重音知觉对比。重音标注完成后,重音语料库也随之建立起来。这个大规模的重音语料库具备词重音和句重音信息,适用于语音合成领域,能较好地提高合成语音的自然度。  相似文献   

8.
基于语料库的藏语TTS技术研究   总被引:1,自引:0,他引:1  
文章通过比较分析国内外TTS技术的发展,提出基于语料库的藏语TTS技术的可行性.研究了藏语TTS的文本分析模块、语音合成模块及语音数据库的关键技术,并设计了一个完整的基于语料库的藏语TTS系统.  相似文献   

9.
建立了一个兰州方言语料库.利用<方言调查字表>设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究.  相似文献   

10.
本论述通过实验语音学的方法,运用语音格局理论,从元音格局的角度对藏语拉萨话元音进行分析,考察元音的定位特征、内部变体的表现以及整体的分布关系。藏语拉萨话元音格局的分析,对于认识藏语拉萨话元音中所表现的元音规律以及它们各自的个性特征都是极有意义的。  相似文献   

11.
在蒙古语语音合成系统中,语料库的好坏会直接影响语音合成的效果.因此,语料库标注规则的设计对语音合成工作具有重要意义.提出了一种新的蒙古语语音合成语料库的标注规则,并用按此规则标注的蒙古语语料库进行了基于隐马尔科夫模型的蒙古语语音合成实验,合成效果达到了预期目标,说明我们提出的标注规则是合理可靠的.  相似文献   

12.
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低.  相似文献   

13.
由于传统语料标注方法耗时耗力,已经难以适应大数据语料的处理,该文提出了大数据语音语料库的社会标注策略。引入了针对语音数据标注的六元组模型,将语音资源的自身特征考虑进去,并将标签对象扩展为更为广义的标记。提出基于"兴趣+收获+报酬"的标注模式,并建立标注质量的3层检验机制。通过工程实现和应用,验证了本文方法在标注效率、质量和成本等方面都具有明显优势。同时,该标注策略可以推广到其他语料的标注,特别是对主观性较强的翻译语料和评价型语料的标注。  相似文献   

14.
语音拨号是语音识别的一个重要分支,其在手机中的应用更加广泛.但是目前国内语音拨号技术主要应用于汉语,藏语拉萨话的开发还相对较少.HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别等领域.文章从HTK的基本原理和软件结构出发,设计了一个基于HTK的拉萨话语音拨号系统,并验证了其识别效率.对于开发拉萨话手机语音拨号,推动藏语信息化建设和方便藏族群众生活都有着一定的现实意义.  相似文献   

15.
采用语料库方法,构建了一个具有4500余条词的白马藏语语音库,并做了规范的音标标注。该库涵盖了《藏语方言调查表》91%的词汇,包含了白马藏语固有的语音和词汇特征,完全能够代表白马藏语普遍的语言现象。依据语音库标注信息,从发音部位和发音方法两方面对白马藏语声母和韵母的音位系统进行了统计分析,获得了详细的白马藏语音系数据。同时,按发音方法归纳了声母与韵母的组合规律及其分布特征,总结了白马藏语语音与藏语书面语的对应关系,为今后的白马藏语研究提供了详实的数据和新的研究思路。  相似文献   

16.
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。  相似文献   

17.
藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提。语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要。文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法。  相似文献   

18.
藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提.语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要.文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法.  相似文献   

19.
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。  相似文献   

20.
针对几百小时粗标注大语料库, 提出一种新颖的语音合成系统构建方法。首先, 借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。 然后, 为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题, 优化了传统的训练流程, 在不损失声学模型准确性的前提下, 显著提高了模型的训练速度。主观实验表明, 与具有精标注的小语料库相比, 引入粗标注的大语料库可以带来0.5分左右的MOS提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号