首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Nutch的搜索引擎技术
引用本文:刘高原,张国平.基于Nutch的搜索引擎技术[J].平顶山学院学报,2008,23(5).
作者姓名:刘高原  张国平
作者单位:平顶山学院,河南,平顶山,467000
摘    要:Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询.为了使它能够支持中文搜索,在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能.

关 键 词:搜索引擎  分词  正规式

Study on Chinese Search Technology for Java-Based Search Engine-Nutch
LIU Gao-yuan,ZHANG Guo-ping.Study on Chinese Search Technology for Java-Based Search Engine-Nutch[J].Journal of Pingdingshan University,2008,23(5).
Authors:LIU Gao-yuan  ZHANG Guo-ping
Institution:LIU Gao-yuan,ZHANG Guo-ping(Pingdingshan University,Pingdingshan,Henan 467000,China)
Abstract:
Keywords:Nutch
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号