首页 | 本学科首页   官方微博 | 高级检索  
     

非平行文本下基于变分自编码器和辅助分类器生成对抗网络的语音转换
作者姓名:李燕萍  曹盼  石杨  张燕  钱博
作者单位:1. 南京邮电大学通信与信息工程学院;2. 金陵科技学院软件工程学院;3. 南京电子技术研究所
摘    要:提出了1种基于变分自编码器和辅助分类器生成对抗网络的语音转换方法,实现了非平行文本条件下多对多的高质量语音转换.在该方法中,利用辅助分类器生成对抗网络替代基于变分自编码器和生成对抗网络模型中的Wasserstein生成对抗网络.由于辅助分类器生成对抗网络将特征样本的类别标签作为辅助信息,其鉴别器不仅能预测样本真假,还能预测生成样本所属的类别,从而提高了生成对抗网络的生成效果.充分的客观和主观评价表明:本文提出的方法明显优于基准模型,在显著改善语音质量的同时也有效提升了说话人个性的相似度.

关 键 词:语音转换  变分自编码器  非平行文本  辅助分类器生成对抗网络  多对多
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号