结合高斯混合模型和VOT特征的音素发音错误检测 |
| |
作者姓名: | 刘明辉 黄中伟 |
| |
作者单位: | 深圳大学,深圳大学 |
| |
基金项目: | 国家自然科学基金项目(面上项目,重点项目,重大项目) |
| |
摘 要: | 结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。
|
关 键 词: | 语音识别 发音错误检测 高斯混合模型 嗓音起始时间 |
收稿时间: | 2012-09-18 |
修稿时间: | 2012-10-11 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|