首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于最小二乘法和高斯混合模型的语音转歌声算法
引用本文:段伟博,朱梦尧,朱晓强,王涛.基于最小二乘法和高斯混合模型的语音转歌声算法[J].复旦学报(自然科学版),2019,58(3).
作者姓名:段伟博  朱梦尧  朱晓强  王涛
作者单位:上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444
基金项目:国家自然科学基金;国家自然科学基金;国家自然科学基金;上海市科委重点项目
摘    要:设计了一种语音转歌声的合成器.在给定一段朗读的歌词语音文件和乐谱的信息条件下,合成器系统按照传递函数调整说话人语音的3个声学参数:基频、语音时长和频谱包络.为了构造传递函数,本文使用机器学习的方法研究了歌声的基频和频谱包络.系统选择最小二乘法去学习歌声基频中颤音的参数,用来生成歌声带有颤音的基频;利用高斯混合模型(Gaussian Mixture Model,GMM)学习歌声频谱包络和说话人频谱包络的映射关系,将说话声音的频谱包络转换为音乐带有特定共振峰的频谱包络;根据节拍信息来修改说话语音时长.最终得到的3个参数可以合成音乐歌声,实现机器学习下的语音转歌声.实验结果表明,该合成器能够将说话声音转换为较好的歌声.

关 键 词:语音转歌声  传递函数  基频  频谱包络  最小二乘法  高斯混合模型
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号