基于最小二乘法和高斯混合模型的语音转歌声算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于最小二乘法和高斯混合模型的语音转歌声算法

作者姓名：	段伟博朱梦尧朱晓强王涛

作者单位：	上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444;上海大学通信与信息工程学院,上海,200444

基金项目：	国家自然科学基金;国家自然科学基金;国家自然科学基金;上海市科委重点项目

摘要：	设计了一种语音转歌声的合成器.在给定一段朗读的歌词语音文件和乐谱的信息条件下,合成器系统按照传递函数调整说话人语音的3个声学参数:基频、语音时长和频谱包络.为了构造传递函数,本文使用机器学习的方法研究了歌声的基频和频谱包络.系统选择最小二乘法去学习歌声基频中颤音的参数,用来生成歌声带有颤音的基频;利用高斯混合模型(Gaussian Mixture Model,GMM)学习歌声频谱包络和说话人频谱包络的映射关系,将说话声音的频谱包络转换为音乐带有特定共振峰的频谱包络;根据节拍信息来修改说话语音时长.最终得到的3个参数可以合成音乐歌声,实现机器学习下的语音转歌声.实验结果表明,该合成器能够将说话声音转换为较好的歌声.
关键词：	语音转歌声传递函数基频频谱包络最小二乘法高斯混合模型
本文献已被 CNKI 万方数据等数据库收录！