基于XML /Schema 甲骨文语料库语料标注的研究 |
| |
引用本文: | 吴琴霞.基于XML /Schema 甲骨文语料库语料标注的研究[J].科学技术与工程,2009,9(17). |
| |
作者姓名: | 吴琴霞 |
| |
作者单位: | 安阳师范学院计算机与信息工程学院,安阳,455000 |
| |
摘 要: | 对语料库进行语料标注是实现原始语料信息计算机可读的关键.采用XML+XML Schema对甲骨文语料库进行结构化标注,使不同类型的数据表示成统一的格式,方便数据的交换与共享.给出了一种依据XML文档中使用的词汇集,对词汇集进行建模来约束XML文档中使用的元素和属性及其之间的结构关系和数据类型.根据定义好的XMLSchema使用XML对甲骨文信息进行结构化标注,可以准确地描述数据的结构及数据类型.
|
关 键 词: | 语料库 元数据 信息抽取 |
收稿时间: | 2009/5/17 0:00:00 |
修稿时间: | 6/4/2009 12:00:00 AM |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
| 点击此处可从《科学技术与工程》下载免费的PDF全文 |
|