首页 | 本学科首页   官方微博 | 高级检索  
     检索      

电话语音双人检测算法
引用本文:李科,刘加.电话语音双人检测算法[J].清华大学学报(自然科学版),2007,47(1):65-68.
作者姓名:李科  刘加
作者单位:清华大学,电子工程系,北京,100084
基金项目:国家自然科学基金;信息产业部信息安全计划项目
摘    要:为了提高两个说话人情况下电话语音双人检测的性能,提出了一种基于长时距离与短时距离之和的双人语音分段算法,并对分段过程中的聚类过程进行了改进。对于分段得到的语音采用基于GMM-UBM(Gaussian mixturemodel-universal background model,GMM-UBM)模型的说话人确认算法,构成一个电话语音双人检测系统。实验结果表明:在美国国家标准技术局1999年组织的年度说话人识别评测双人检测数据库上的检测等错误率为15.1%。该算法取得了良好的效果。

关 键 词:语音信号处理  说话人识别  聚类  通用似然比距离
文章编号:1000-0054(2007)01-0065-04
修稿时间:2005年12月16

Detection algorithm for two-person conversations
LI Ke,LIU Jia.Detection algorithm for two-person conversations[J].Journal of Tsinghua University(Science and Technology),2007,47(1):65-68.
Authors:LI Ke  LIU Jia
Abstract:An algorithm is given to detect and track speakers in two-person telephone conversations.The approach uses a Gaussian mixture model with a universal background model(GMM-UBM) of speaker detection system as the core speaker recognition engine.The segmentation algorithm is based on the sum of the long-term distance and short-term distance measures,with an improved clustering process.Experiments on the NIST'99 evaluation database show that the detection system based on the segmentation algorithm provides good performance with an EER of 15.1%.
Keywords:speech signal processing  speaker detection  clustering  GLR(generalized likelihood ratio) distance
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号