基于混合Gauss归一化的语音转换方法 |
| |
引用本文: | 宋鹏,王浩,赵力.基于混合Gauss归一化的语音转换方法[J].清华大学学报(自然科学版),2013(6):757-761. |
| |
作者姓名: | 宋鹏 王浩 赵力 |
| |
作者单位: | 东南大学信息科学与工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(61273266) |
| |
摘 要: | 针对非对称语料库情况下的语音转换,提出了一种基于混合Gauss归一化的语音转换方法。通过背景说话人模型,分别自适应训练得到源说话人和目标说话人模型。利用训练得到的模型自适应参数,提出了基于Gauss归一化的特征映射方法,为了进一步提高转换效果,进而提出了混合Gauss归一化的方法。针对说话人模型中未被更新的参数,采用KL散度(Kullback-Leibler divergence)方法进行了优化。最后通过主客观实验对提出的算法的有效性进行了仿真和验证。实验结果表明:该文提出的基于混合Gauss归一化的语音转换方法,在倒谱失真度、转换语音的目标倾向度以及感知质量上,都获得了接近基于对称语音库的传统Gauss混合模型(Gaussian mixture model,GMM)方法的效果。
|
关 键 词: | 语音转换 非对称语料库 混合Gauss归一化 |
本文献已被 CNKI 等数据库收录! |
|