面向大语料库的语音合成方法研究 Research on Speech Synthesis for Large-Scale Corpora期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向大语料库的语音合成方法研究

引用本文：	于延锁,朱风云,李先刚,刘翼,吴玺宏. 面向大语料库的语音合成方法研究[J]. 北京大学学报(自然科学版), 2014, 50(5): 791-796

作者姓名：	于延锁朱风云李先刚刘翼吴玺宏

作者单位：	北京大学言语听觉研究中心, 机器感知与智能教育部重点实验室, 北京100871;

基金项目：	国家自然科学基金(91120001,61121002);国家社会科学基金重大项目(12&ZD119);国家重点基础研究发展计划(2013CB329304)资助

摘要：	针对几百小时粗标注大语料库, 提出一种新颖的语音合成系统构建方法。首先, 借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后, 为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题, 优化了传统的训练流程, 在不损失声学模型准确性的前提下, 显著提高了模型的训练速度。主观实验表明, 与具有精标注的小语料库相比, 引入粗标注的大语料库可以带来0.5分左右的MOS提升。
关键词：	语音数据筛选声学模型训练基于HMM的单元挑选与波形拼接
收稿时间：	2013-05-09
Research on Speech Synthesis for Large-Scale Corpora

YU Yansuo;ZHU Fengyun;LI Xiangang;LIU Yi;WU Xihong. Research on Speech Synthesis for Large-Scale Corpora[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(5): 791-796

Authors:	YU Yansuo ZHU Fengyun LI Xiangang LIU Yi WU Xihong

Affiliation:	Speech and Hearing Research Center, Key Laboratory of Machine Perception MOE, Peking University, Beijing 100871;

Abstract:

Keywords:	speech data selection acoustic model training HMM-based unit selection and waveform concatenation
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《北京大学学报(自然科学版)》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏