中文分词技术的研究及在Nutch中的实现 |
| |
引用本文: | 王巧玲,彭静,王春红.中文分词技术的研究及在Nutch中的实现[J].科技信息,2011(19):I0038-I0039. |
| |
作者姓名: | 王巧玲 彭静 王春红 |
| |
作者单位: | 河北科技大学信息科学与工程学院,河北石家庄050018 |
| |
基金项目: | 河北省科技支撑计划项目资助(10213557). |
| |
摘 要: | 研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。
|
关 键 词: | Nutch 中文分词 搜索引擎 |
本文献已被 维普 等数据库收录! |
|