基于最小二乘法和高斯混合模型的语音转歌声算法 |
| |
作者姓名: | 段伟博 朱梦尧 朱晓强 王涛 |
| |
作者单位: | 上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金;国家自然科学基金;上海市科委重点项目 |
| |
摘 要: | 设计了一种语音转歌声的合成器.在给定一段朗读的歌词语音文件和乐谱的信息条件下,合成器系统按照传递函数调整说话人语音的3个声学参数:基频、语音时长和频谱包络.为了构造传递函数,本文使用机器学习的方法研究了歌声的基频和频谱包络.系统选择最小二乘法去学习歌声基频中颤音的参数,用来生成歌声带有颤音的基频;利用高斯混合模型(Gaussian Mixture Model,GMM)学习歌声频谱包络和说话人频谱包络的映射关系,将说话声音的频谱包络转换为音乐带有特定共振峰的频谱包络;根据节拍信息来修改说话语音时长.最终得到的3个参数可以合成音乐歌声,实现机器学习下的语音转歌声.实验结果表明,该合成器能够将说话声音转换为较好的歌声.
|
关 键 词: | 语音转歌声 传递函数 基频 频谱包络 最小二乘法 高斯混合模型 |
本文献已被 CNKI 万方数据 等数据库收录! |
|