基于Web的语料自动采集技术研究 |
| |
作者姓名: | 郭浩 刘伟 段富 |
| |
作者单位: | 太原理工大学计算机与软件学院 中国电子科技集团第三十三研究所 |
| |
摘 要: | 在为词典编撰进行大规模语料采集工作的背景下,以实现语料的批量自动采集为目的,介绍了基于Web的词典编撰语料自动采集技术。同时提出了该技术在图书信息领域的实验模型,图书信息搜寻系统(SearchBook v2.1.0)的设计与实现,包括如何利用搜索引擎技术及信息提取技术进行图书信息的搜索及提取。
|
关 键 词: | 语料采集 搜索引擎 信息抽取 |
本文献已被 维普 等数据库收录! |
|