首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无用词的功能,从而首先实现了PostgreSQL的中文全文索引.  相似文献   

2.
为在网络数据中搜索到所需相关数据, 通过对基于后缀数组的全文索引结构的改进研究, 设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构加权有向词图。通过实验证明, 加权有向词图在相同问题规模下能降低存储空间, 同时不影响检索的效率, 是一种更为高效的全文索引结构。  相似文献   

3.
李岩 《当代地方科技》2010,(15):118-118
本文分析了现今全文索引技术的现状。重点介绍了SQL Server2005数据库系统下实现全文索引的过程,并以实例分析了SQL Server2005实现全文索引技术的简易过程,介绍了实现该技术的部分代码。  相似文献   

4.
随着网络的发展,用户对搜索引擎的要求越来越高,Lucene是一个用Java写的全文索引引擎工具包,可以方便的嵌入到各种应用程序中,与传统的搜索引擎相比,它更快捷、更准确的实现全文索引/检索功能。  相似文献   

5.
详细描述了索引的概念,优缺点,重点介绍了4种索引的特征与注意事项,索引的创建原则,语法及重要选项说明,并对索引的性能优化进行了全面的阐述,最后介绍了索引调整向导以及全文索引,这对深入地认识,理解和使用索引有一定的理论价值和实践意义。  相似文献   

6.
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。  相似文献   

7.
赵力 《科技信息》2009,(11):32-33
本文简要介绍了Web搜索引擎的基本原理、核心技术和处理流程,并详细介绍了相关组成技术的概念和系统整体工作流程。并基于c≠≠的全文索引引擎DotLucene软件包入手,简要介绍了Web网站站内信息搜索系统的基本开发过程和方法。  相似文献   

8.
基于Lucene的网站全文搜索的设计与实现   总被引:6,自引:0,他引:6  
Lucene是一个基于Java技术的开放源代码全文索引引擎工具包,它可以方便地嵌入到各种应用中实现针对应用的全文索引/检索功能。利用Lucene的API可以比较万便地为一个网站提供全文搜索功能。探讨了如何使用Lucene建造一个通用的Web站点全文搜索工具,并对在构建系统中应注意的若干问题进行了探讨。  相似文献   

9.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

10.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

11.
合理选择中文电子期刊数据库   总被引:6,自引:0,他引:6  
对清华同方公司的中国期刊网全文数据库、重庆维普公司的中文科技期刊全文数据库和北京万方公司的万方数据——中国数字化期刊群在收录范围、检索功能、服务系统、价格等方面进行了比较分析,为图书馆在选择和使用上述数据库时提供了参考。  相似文献   

12.
对目前流行的全文检索技术——基于Lucene引擎的全文检索和SQLServer附带的全文检索功能组件Microsoft Search进行了分析研究,实现相应的检索接口,封装为Web服务且集成到使用面向服务架构的分布式仿真资源库中.通过相关性能测试,验证了全文检索接口封装为Web服务并应用于面向服务架构的可行性,结果表明基于Lucene的检索服务总体性能优于基于Microsoft Search的检索服务.  相似文献   

13.
Lucene 是一个优秀的开源的全文搜索技术框架,按照框架规范,扩展它的功能,可以将它很好地嵌入到搜索引擎中。研究了 Lucene 的索引结构和原理,通过改进增量索引、增大索引缓冲区的大小和减少往磁盘上写索引文件的频率,达到提高创建索引效率的目的。设计了全文检索实验,实验结果表明,该方法使10000篇文档创建索引的平均效率比前人方法提高了19.5%,具有良好的应用前景。  相似文献   

14.
多媒体素材库是远程教学传统资源数字化的存储媒体,也是教师、学生的教学和学习资源中心.多媒体素材库必须有强大的多媒体信息存储、检索与管理功能.以全文检索技术为核心,结合多媒体数据库技术和流媒体技术建设而成的多媒体素材库检索精度和效率非常高.  相似文献   

15.
两大全文期刊数据库收录科技期刊的现状调查   总被引:1,自引:0,他引:1  
目前国内最享有盛誉和用户最多的全文期刊数据库是中文科技期刊全文数据库和中国期刊全文数据库。以2005年国内外公开发行的1168种印刷版科技期刊为调查对象,对两大中文全文期刊数据库收录科技期刊的现状进行了调查。  相似文献   

16.
给出了一种针对目标网站的全文搜索系统的程序框架图,介绍了其工作原理及实现过程.在全文信息数据库的建立过程中,针对HTML文档的特点,提出了网页特征信息提取技术,有效地减少了信息存储量.最后,给出了应用结果.  相似文献   

17.
介绍了数字资源公共服务平台功能设计,提出了数字资源公共服务平台的系统技术指标,分析了数字资源公共服务平台的系统构成和各个子系统的功能要求,并对一些重要指标进行了论述。  相似文献   

18.
针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号