基于分段动态时间规整和后验特征的中文语音模式发现期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于分段动态时间规整和后验特征的中文语音模式发现

引用本文：	杨鹏,谢磊,陈虹洁.基于分段动态时间规整和后验特征的中文语音模式发现[J].清华大学学报(自然科学版),2013(6):903-907.

作者姓名：	杨鹏谢磊陈虹洁

作者单位：	西北工业大学计算机学院,陕西省语音与图像信息处理重点实验室

基金项目：	国家自然科学基金项目(61175018);陕西省自然科学研究计划(2011JM8009);霍英东基金项目(131059)

摘要：	语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。
关键词：	语音模式发现后验特征动态时间规整分段动态时间规整
本文献已被 CNKI 等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏