排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
周文勤 《甘肃联合大学学报(自然科学版)》2012,(4):52-56
对全文检索技术进行了介绍,提出了一种基于网络爬虫Heritrix和开源全文信息检索包Lucence的全文检索解决方案.该方案将Web应用中经常用到的全文检索功能进行封装,使其可以很方便地被集成到Java EE项目中.本方案被用于校园网内容检索功能的实现,实践证明,该解决方案简单易用、应用效果较好. 相似文献
2.
介绍了垂直搜索引擎和网络爬虫的基本概念,以及Heritrix系统的体系结构,分析了Heritrix工作流程,针对Hefifirx中存在的一些不完善的地方,引入了ELFHash算法并通过扩展Heritrix实现了电信信息搜索平台信息的定向与多线程抓取,为建立面向电子信息的垂直搜索引擎提供了信息源. 相似文献
1