基于语料库的数量名短语识别 |
| |
作者姓名: | 方芳 |
| |
作者单位: | 安徽师范大学国际教育学院,安徽芜湖,241003 |
| |
摘 要: | 数量名短语的自动识别是中文信息处理中短语识别的重要内容,对汉语深层次句法分析和语义分析将起到很重要的作用。本文对"数.量.名"、量词重叠的数量名短语进行自动识别,以量名搭配概率为基础,提出了基于变长后缀匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点。我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值。
|
关 键 词: | 数量名短语 短语识别 搭配识别 中文信息处理 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|