智能环境中音视频双模态的身份辨识 Audio-visual bimodal speaker identification in a smart environment期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

智能环境中音视频双模态的身份辨识

引用本文：	陈雁翔,刘鸣. 智能环境中音视频双模态的身份辨识[J]. 中国科学技术大学学报, 2010, 40(5). DOI: 10.3969/j.issn.0253-2778.2010.05.0008

作者姓名：	陈雁翔刘鸣

作者单位：	1. 合肥工业大学计算机与信息学院,安徽合肥,230009 2. 伊利诺伊大学香槟分校电子计算机工程系,伊利诺伊州,61801

摘要：	首先描述了智能环境下一种基于语音和人脸图像的双模态的身份辨识系统;然后在基于语音的说话人辨识中采用改进的基于语音段的高斯混合模型,在基于人脸的身份辨识中利用K近邻法对整个视频序列而非单个静止图做判决;最后在评分层通过对双模态输出的评分进行规整和加权组合实现融合.实验表明,音视频双模态融合能有效提高身份辨识系统的正确率.
关键词：	身份辨识音视频双模态融合智能环境
Audio-visual bimodal speaker identification in a smart environment

CHEN Yanxiang,LIU Ming. Audio-visual bimodal speaker identification in a smart environment[J]. Journal of University of Science and Technology of China, 2010, 40(5). DOI: 10.3969/j.issn.0253-2778.2010.05.0008

Authors:	CHEN Yanxiang LIU Ming

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！