IBM GALE中文识别系统 |
| |
引用本文: | 张世磊,施勤,秦勇,刘文,CHU StephenM,KUO Hong-Kwang,MANGU Lidia.IBM GALE中文识别系统[J].清华大学学报(自然科学版),2009(Z1). |
| |
作者姓名: | 张世磊 施勤 秦勇 刘文 CHU StephenM KUO Hong-Kwang MANGU Lidia |
| |
作者单位: | IBM中国研究院;IBM华生研究中心; |
| |
摘 要: | 为解决中文音频自动转成文字问题,IBM开发了GALE中文识别系统。该系统采用区分性声学模型训练方法和新颖的基于主题的语言模型自适应技术;为获得最优的识别性能,系统采用多遍解码的识别策略。该文还给出该系统在3个测试集上的识别结果:包括广播新闻和广播访谈节目,结果显示,IBM GALE中文识别系统取得了很好的识别性能;此外,该文还分析了特殊声学现象对识别结果的影响,结果显示,对识别率影响最大的3种声学现象为说话人语速过快、语音交叠和口音问题,这指示了系统下一步的改进方向。
|
关 键 词: | 语音识别 区分型模型训练 语言模型自适应 多遍解码 |
本文献已被 CNKI 等数据库收录! |
|