首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于VP树结构的多层匹配算法在哼唱识别中的应用
引用本文:侯珏,刘轶,郑方,蒋丹宁,秦勇,黄石磊,刘勇.基于VP树结构的多层匹配算法在哼唱识别中的应用[J].清华大学学报(自然科学版),2009(Z1).
作者姓名:侯珏  刘轶  郑方  蒋丹宁  秦勇  黄石磊  刘勇
作者单位:清华大学信息技术研究院语音和语言技术中心;清华信息科学技术国家实验室技术创新与开发部;语音和语言技术中心;IBM中国研究院;深港产学研基地产业发展中心;
基金项目:IBM与清华大学合作项目(2007-2008)
摘    要:哼唱识别是音频检索的一个重要应用,其难点是音频歌曲数据的非结构性以及搜索速度和准确率平衡的问题。该文提出了新的数据库构造方法,将音频歌曲集用手工标注方法提取主旋律并且按自然演唱停顿方式进行分段,采用段落结构而不是整首歌作为索引。同时,提出了一种基于VP树的搜索结构以及相应的多级搜索算法,在快速匹配层采用粗搜索算法,在精确匹配层采用基于动态时间规整算法。实验证明,在对检出率影响不大的前提下,识别速度提高了40%以上。

关 键 词:检索机  哼唱识别  VP树  动态时间规整  

VP-tree based multi-stage matching algorithm for query-by-humming systems
HOU Jue,LIU Yi,ZHENG Fang,JIANG Danning,QIN Yong,HUANG Shilei,LIU Yong.VP-tree based multi-stage matching algorithm for query-by-humming systems[J].Journal of Tsinghua University(Science and Technology),2009(Z1).
Authors:HOU Jue    LIU Yi  ZHENG Fang  JIANG Danning  QIN Yong  HUANG Shilei  LIU Yong
Institution:1.Center for Speech and Language Technologies;Research Institute of Information Technology;Tsinghua University;Beijing 100084;China;2.Division of Technology Innovation and Development;Center for Speech and Language Technologies;Tsinghua National Laboratory for Information Science and Technology;3.IBM China Research Lab;Beijing 100094;4.PKU HKUST Shenzhen Hong Kong Institution;Shenzhen 518057;China
Abstract:Query by humming(QBH) is an important application for musical information retrieval.The key challenges in QBH are the unstructured data modules in audio songs and the balance between searching speed and accuracy.This paper presents a data structure for audio songs using a hand labeling method to label the melody and to divide the songs into natural segments.The search index uses the segmentation structure rather than the entire lyrics for the song.The system generates a VP-tree search structure with a multi...
Keywords:musical information retrieval  query by humming  VP-tree  dynamic time warping  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号