基于语义提升HMM的语义标注 |
| |
作者姓名: | 李向阳 张亚非 陆建江 |
| |
作者单位: | 解放军理工大学,通信工程学院,江苏,南京,210007;解放军理工大学,训练部,江苏,南京,210007;东南大学,计算机科学与工程系,江苏,南京,210096 |
| |
基金项目: | 国家自然科学基金资助项目 (60 3 0 3 0 2 4) |
| |
摘 要: | 语义标注所用标签数目众多,训练数据更为稀疏,用HMM作语义标注面临参数估计不准的难题。不同于传统的解决数据稀疏方法,以《同义词词林》的层次式结构为依据,提出了利用语义层次的提升来改善HMM(hidden Markov model)中参数的估计质量;在算法实现中,采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题。测试表明,在训练数据相对稀疏的情况下,适度调整模型的语义层次可大幅提高语义标注的精度,该方法表现出较好的可塑性。
|
关 键 词: | 语义标注 隐马尔可夫模型 层次结构 自然语言处理 |
文章编号: | 1009-3443(2005)01-0030-06 |
修稿时间: | 2004-05-19 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《解放军理工大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《解放军理工大学学报(自然科学版)》下载全文 |
|