快速准确的自动音乐/语音分段方法 |
| |
作者姓名: | 万玉龙 周若华 颜永红 |
| |
作者单位: | 中国科学院声学研究所,语言声学与内容理解重点实验室 |
| |
基金项目: | 国家自然科学基金项目(10925419,90920302,61072124,11074275,11161140319,91120001,61271426);中国科学院战略性先导科技专项(XDA06030100,XDA06030500);国家“八六三”高技术项目(2012AA012503);中科院重点部署项目(KGZD-EW-103-2) |
| |
摘 要: | 自动音乐/语音分段是语音识别技术的重要部分。该文采用回声器时频分析计算平均能量谱及定长片段的优化短时低能量比,用Bayes分类器判定类型,并根据内容连续性对分段结果修正;最后采用振幅包络匹配滤波器求所有起始点,对分段结果进一步优化。实验基于多语种电视电台录音和国内电话录音数据展开,结果显示该方法的性能FMeasure可达0.987,较已有分类系统性能有大幅提升,同时处理速度也有大幅度改进。
|
关 键 词: | 音乐/语音分段 回声器时频分析(RTFI) 优化短时低能量比 起始点侦测 |
本文献已被 CNKI 等数据库收录! |
|