基于多特征I-Vector的说话人识别算法 |
| |
作者姓名: | 赵宏 岳鲁鹏 常兆斌 王伟杰 |
| |
作者单位: | 兰州理工大学 计算机与通信学院,甘肃 兰州 730050 |
| |
基金项目: | 国家自然科学基金(51668043),赛尔网络下一代互联网技术创新项目(NGII20160311, NGII20160112) |
| |
摘 要: | 针对单一声学特征无法精准高效地辨识说话人身份的问题,提出了一种基于多特征I-Vector的说话人识别算法.该算法首先采集不同的声学特征并将其构成一个高维特征向量,然后通过主成分分析法有效地剔除高维特征向量的关联,确保各种特征之间正交化,最后采用概率线性判别分析进行建模和打分,并在一定程度上降低空间维度.在TIMIT语料库上利用Kaldi进行实验,算法运行结果表明,该算法较当前流行的基于I-Vector的单一梅尔频率倒谱系数和感知线性预测系数的特征系统在等错误率上分别提高了8.18%和1.71%,在模型训练时间上分别减少了60.4%和47.5%,具有更好的识别效果和效率.
|
关 键 词: | 说话人识别算法 多特征I-Vector 主成分分析 概率线性判别分析 Kaldi |
收稿时间: | 2019-12-19 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《兰州理工大学学报》浏览原始摘要信息 |
|
点击此处可从《兰州理工大学学报》下载全文 |
|