排序方式: 共有87条查询结果,搜索用时 93 毫秒
1.
本文通过分析校园网网站信息的特点,采用Nutch网络爬虫和Lucene技术构建一个校园网全文检索系统,解决了中文分词等问题,提高了用户搜索的效率。 相似文献
2.
通过分析基于单字或词的全文检索方法,讨论衡量信息检索速度的一个重要指标———系统最长检索时间.针对中文海量信息,提出了一个基于任意字串的快速全文检索算法. 相似文献
3.
本文对Lucene中文切词算法进行改进,提出将基于网络有向图的双向匹配分词算法应用于Lucene的中文切词器,提高了检索的准确性和检索性能。 相似文献
4.
对目前流行的全文检索技术——基于Lucene引擎的全文检索和SQLServer附带的全文检索功能组件Microsoft Search进行了分析研究,实现相应的检索接口,封装为Web服务且集成到使用面向服务架构的分布式仿真资源库中.通过相关性能测试,验证了全文检索接口封装为Web服务并应用于面向服务架构的可行性,结果表明基于Lucene的检索服务总体性能优于基于Microsoft Search的检索服务. 相似文献
5.
一种基于语词的分词方法 总被引:10,自引:0,他引:10
提出了一种基于语词的分词系统 ,设计了相应的分词词典 .该分词词典支持词条首字Hash查找和标准的不限词条长度的二分查找算法 ,并应用于全文检索中 .结果分析表明 ,此分词系统无论是在检索速度上 ,还是在歧义处理上都有很大的改进 相似文献
6.
7.
Lucene 是一个优秀的开源的全文搜索技术框架,按照框架规范,扩展它的功能,可以将它很好地嵌入到搜索引擎中。研究了 Lucene 的索引结构和原理,通过改进增量索引、增大索引缓冲区的大小和减少往磁盘上写索引文件的频率,达到提高创建索引效率的目的。设计了全文检索实验,实验结果表明,该方法使10000篇文档创建索引的平均效率比前人方法提高了19.5%,具有良好的应用前景。 相似文献
8.
基于Compass的全文检索系统在图情学科信息共享空间平台的研究与开发 总被引:1,自引:0,他引:1
Compass是一个基于Lucene的、开源的、事务的、可灵活配置的、高性能的对象/搜索引擎框架与Java持久层框架。本文提出了一种基于Compass的图情学科信息共享空间全文检索系统的实现方式,讨论了系统实现的关键技术,集成Hibernate3.3共同实现数据的持久层,集成Struts2实现系统的控制层,集成Spring3.0实现AOP以及事务管理,大大减化了索引的创建、优化、与数据库的同步更新。 相似文献
9.
全文检索系统的数据库设计 总被引:1,自引:0,他引:1
应用软件工程的方法对全文检索系统的数据库进行规范化设计,给出了系统数据库组织结构图。 相似文献
10.
利用计算机及其软件,网络技术和网络应用开发软件,对单个网站汉字文章的检索及其原理,多个网站汉字文章的检索及其原理,即时检索结果的分发问题和原理,定期检索结果的分发和原理,逻辑表达式检索的解析和原理等,进行了研究和探讨。 相似文献