基于鉴别性向量空间模型的语种识别 |
| |
作者姓名: | 刘巍巍 张卫强 刘加 |
| |
作者单位: | 清华大学电子工程系,清华信息科学与技术国家实验室 |
| |
基金项目: | 国家自然科学基金项目(61005019,61273268) |
| |
摘 要: | 传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性向量空间模型(D-VSMs)建模方法。D-VSMs能够自动过滤训练集中信息重叠的数据,使得每一个支持向量机的训练数据都有针对性,从而用较少的训练数据能取得较好的分类效果。在美国国家标准技术局(NIST)2009年语种识别测试中,D-VSMs只用了原训练数据的25%,计算量是传统并行音素识别器后接向量空间模型(PPRVSM)的10%,等错误率在30s、10s和3s的测试条件下分别比传统PPRVSM下降了12.75%、15.89%以及7.33%。
|
关 键 词: | 语种识别 鉴别性向量空间模型(D-VSMs) 并行音素识别器后接向量空间模型(PPRVSM) |
本文献已被 CNKI 等数据库收录! |
|