条件随机场图模型在《明史》词性标注研究中的应用效果探索 |
| |
引用本文: | 朱晓,金力.条件随机场图模型在《明史》词性标注研究中的应用效果探索[J].复旦学报(自然科学版),2014(3). |
| |
作者姓名: | 朱晓 金力 |
| |
作者单位: | 复旦大学生命科学学院; |
| |
摘 要: | 自然语言处理作为人工智能领域的一个重要分支,随着计算机信息处理技术的发展,已经取得较大进展.但是古汉语信息处理研究却相对滞后.本研究选择编年体体裁的《明史》作为研究语料,通过交叉检验方法比较了基于条件随机场的三种图模型(无边图模型、完全图模型以及嵌套图模型)在古汉语词性标注中的应用,发现完全图模型和嵌套图模型在《明史》的词性标注中的效果优于无边图模型,分词(Word Segmentation)在一定程度上可以提高古汉语词性标注的效率.另外,还发现基于条件随机场的图模型在分词前后对测试集中未登录词的词性标注效果均比较低.
|
关 键 词: | 《明史》 编年体 词性标注 条件随机场 图模型 |
本文献已被 CNKI 等数据库收录! |
|