首页 | 本学科首页   官方微博 | 高级检索  
     

面向大语料库的语音合成方法研究
引用本文:于延锁,朱风云,李先刚,刘翼,吴玺宏. 面向大语料库的语音合成方法研究[J]. 北京大学学报(自然科学版), 2014, 50(5): 791-796
作者姓名:于延锁  朱风云  李先刚  刘翼  吴玺宏
作者单位:北京大学言语听觉研究中心, 机器感知与智能教育部重点实验室, 北京100871;
基金项目:国家自然科学基金(91120001,61121002);国家社会科学基金重大项目(12&ZD119);国家重点基础研究发展计划(2013CB329304)资助
摘    要:针对几百小时粗标注大语料库, 提出一种新颖的语音合成系统构建方法。首先, 借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。 然后, 为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题, 优化了传统的训练流程, 在不损失声学模型准确性的前提下, 显著提高了模型的训练速度。主观实验表明, 与具有精标注的小语料库相比, 引入粗标注的大语料库可以带来0.5分左右的MOS提升。

关 键 词:语音数据筛选  声学模型训练  基于HMM的单元挑选与波形拼接  
收稿时间:2013-05-09

Research on Speech Synthesis for Large-Scale Corpora
YU Yansuo;ZHU Fengyun;LI Xiangang;LIU Yi;WU Xihong. Research on Speech Synthesis for Large-Scale Corpora[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(5): 791-796
Authors:YU Yansuo  ZHU Fengyun  LI Xiangang  LIU Yi  WU Xihong
Affiliation:Speech and Hearing Research Center, Key Laboratory of Machine Perception MOE, Peking University, Beijing 100871;
Abstract:
Keywords:speech data selection  acoustic model training  HMM-based unit selection and waveform concatenation  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号