首页 | 本学科首页   官方微博 | 高级检索  
     

智能环境中音视频双模态的身份辨识
引用本文:陈雁翔,刘鸣. 智能环境中音视频双模态的身份辨识[J]. 中国科学技术大学学报, 2010, 40(5). DOI: 10.3969/j.issn.0253-2778.2010.05.0008
作者姓名:陈雁翔  刘鸣
作者单位:1. 合肥工业大学计算机与信息学院,安徽合肥,230009
2. 伊利诺伊大学香槟分校电子计算机工程系,伊利诺伊州,61801
摘    要:首先描述了智能环境下一种基于语音和人脸图像的双模态的身份辨识系统;然后在基于语音的说话人辨识中采用改进的基于语音段的高斯混合模型,在基于人脸的身份辨识中利用K近邻法对整个视频序列而非单个静止图做判决;最后在评分层通过对双模态输出的评分进行规整和加权组合实现融合.实验表明,音视频双模态融合能有效提高身份辨识系统的正确率.

关 键 词:身份辨识  音视频  双模态融合  智能环境

Audio-visual bimodal speaker identification in a smart environment
CHEN Yanxiang,LIU Ming. Audio-visual bimodal speaker identification in a smart environment[J]. Journal of University of Science and Technology of China, 2010, 40(5). DOI: 10.3969/j.issn.0253-2778.2010.05.0008
Authors:CHEN Yanxiang  LIU Ming
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号