首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Nutch-0.9中JE中文分词的实现
引用本文:蔡小艳,寇应展,沈巍,郑伟.Nutch-0.9中JE中文分词的实现[J].科学技术与工程,2008,8(17).
作者姓名:蔡小艳  寇应展  沈巍  郑伟
作者单位:1. 军械工程学院计算机工程系,石家庄,050003
2. 北京航空航天大学电子信息工程学院,北京,100083
摘    要:Nutch是一个开放源代码的Web搜索引擎,基于开源搜索框架Lucene,扩展性较好。Nutch是针对英文开发的,对中文只进行单字切分。通过分析Nutch的语言分析器结构,结合基于词库的正向最大匹配分词算法的JE分词,实现了Nutch的中文分词。

关 键 词:Nutch  Lucene  JE分词  中文分词

Realization of JE Chinese Segmentation on Nutch-0.9
CAI Xiao-yan,KOU Ying-zhan,SHEN Wei,ZHEN Wei.Realization of JE Chinese Segmentation on Nutch-0.9[J].Science Technology and Engineering,2008,8(17).
Authors:CAI Xiao-yan  KOU Ying-zhan  SHEN Wei  ZHEN Wei
Abstract:
Keywords:Nutch  Lucene
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号