首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于深层说话人矢量的说话人检索
引用本文:李威,杨继臣,贺前华,李艳雄.基于深层说话人矢量的说话人检索[J].华中科技大学学报(自然科学版),2015(7).
作者姓名:李威  杨继臣  贺前华  李艳雄
作者单位:华南理工大学电子与信息学院,广东广州,510640
基金项目:国家自然科学基金资助项目(61301300);中国博士后科学基金资助项目(2013M531850);中央高校基本科研业务费资助项目(2013ZM0097).
摘    要:为了解决浅层特征不能有效刻画说话人特征,导致说话人检索率不高的问题,提出了一种基于深层说话人矢量的说话人检索方法.使用受限波尔兹曼机逐层构建一个多层的深层特征提取器用以提取说话人深层特征.为说话人构建基于深层特征的深层说话人矢量.通过计算要检索的说话人的深层说话人矢量和检索库中的说话人深层特征之间的最小距离,对目标说话人进行检索.实验结果表明:在深层特征下,使用深层说话人矢量可以检索到绝大部分的目标说话人;随着深度层数的增加,检索率先增后减,检索率最高对应的深度层数是7;随着深度层数的增加,检索时间非线性增加.

关 键 词:深层特征  深层说话人矢量  最小距离  说话人检索  检索率

Speaker retrieval based on deep speaker vector
Li Wei,Yang Jichen,He Qianhua,Li Yanxiong.Speaker retrieval based on deep speaker vector[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2015(7).
Authors:Li Wei  Yang Jichen  He Qianhua  Li Yanxiong
Abstract:
Keywords:deep feature  deep speaker vector  minimal distance  speaker retrieval  retrieval rate
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号