首页 | 本学科首页   官方微博 | 高级检索  
     检索      

语音驱动虚拟说话人的自然头动生成
引用本文:李冰锋,谢磊,朱鹏程,樊博.语音驱动虚拟说话人的自然头动生成[J].清华大学学报(自然科学版),2013(6):898-902.
作者姓名:李冰锋  谢磊  朱鹏程  樊博
作者单位:西北工业大学计算机学院,陕西省语音与图像信息处理重点实验室
基金项目:国家自然科学基金面上项目(61175018);陕西省自然科学基础研究计划(2011JM8009);霍英东基金项目(131059)
摘    要:从语音信号预测伴随头动时,基于隐Markov模型(hidden Markov model,HMM)的头动合成方法的效果依赖于头动模式的划分和头动模式的正确识别。该文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固定的类别描述清楚,因此该类方法的头动模式识别率不高,头动合成效果受限。该文尝试采用逆传播(back-propagation,BP)神经网络的非线性回归方法,通过学习语音与头动之间的映射关系,实现语音信号到头动参数之间的直接连续映射,避免了HMM方法中头动模式不明确、头动模式识别错误带来的负面影响。实验表明,基于BP神经网络的回归方法有效地提高了语音到头动预测的准确度和头动合成的自然度。

关 键 词:虚拟说话人  面部动画  头动生成  隐Markov模型  神经网络
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号