基于转换的无指导词义标注方法 |
| |
作者姓名: | 李涓子 黄昌宁 |
| |
作者单位: | 清华大学,计算机科学与技术系,北京,100084;清华大学,计算机科学与技术系,北京,100084 |
| |
摘 要: | 词义标注是自然语言处理的难题之一。该文提出用于文本词义标注的转换规则自动获取算法及相应的词义排歧算法。该算法用可能的句法关系对语境进行限制,减少了训练数据中的噪音; 为提高学习算法的速度,提出利用预排序方法减少规则搜索次数,以及只调整变化部分数据的计算方法; 并给了改善召回率的词义排歧算法。在近5 万词的语料库上对本算法进行了实验,开放测试的词义排歧正确率为743% 。
|
关 键 词: | 自然语言处理 词义标注 无指导学习 |
修稿时间: | 1998-07-09 |
本文献已被 CNKI 万方数据 等数据库收录! |
|