首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。由于目前全文检索系统的开发平台并不多见,本文介绍了一种全文检索引擎工具包——Lucene,它功能强大,便于嵌入各种应用。本研究对如何利用新技术、改善检索系统的结构、提高检索系统的性能和效率、不断适应中文信息技术发展的需求等方面进行了新的探索。  相似文献   

2.
随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题.对搜集到的藏文网页文本或用户查询关键词进行理解、提取和组织等处理是搜索引擎的一项基础性工作,其中藏文分词的准确与否,直接影响到搜索引擎查询效果及查询结果列表的排序问题,因此分词成为藏文搜索引擎技术中需要解决的关键问题.文章针对藏文搜索引擎中基于字符串匹配的藏文分词技术进行研究并提出相应的解决算法.  相似文献   

3.
随着信息技术的发展,国家电网公司亟待改变人工项目审核的现状,实现项目重复审核自动化。因此,提出了基于Lucene的全文检索技术在电力项目计划审核方面的应用方案。首先深入分析了国家电网公司的项目审核现状和全文检索技术的研究现状,其次简单介绍了全文检索技术和Lucene全文检索引擎的概念,然后详细介绍了全文检索过程;最后将全文检索技术引入电力企业项目计划审核,给出了一个基于全文检索的电力企业项目计划审核系统的架构设计。使用Lucene全文检索引擎进行企业专项项目重复审核,可以方便、快速地获得检索排序结果和文档相似度,并且检索准确度高。  相似文献   

4.
由于Lucene自带的ChineseAnalyzer和CJKAnalyzer两种中文分析器不能够满足全文检索系统的应用,本文给出了一种新的中文分词算法,用于改进Lucene中文分析器。该算法基于字符串匹配原理,实现了正向和逆向相结合的最大增字匹配分词算法。通过实验仿真,比较改进后的分析器与Lucene自带的两种分析器在分词效果和效率上的差异。结果显示,改进后的分析器分词效果明显优于Lucene自带的两种分析器,提高了全文检索系统的中文处理能力,系统的查全率和查准率都达到用户的需求。  相似文献   

5.
通过分析基于单字或词的全文检索方法,讨论衡量信息检索速度的一个重要指标———系统最长检索时间.针对中文海量信息,提出了一个基于任意字串的快速全文检索算法.  相似文献   

6.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

7.
高师信息技术课程在设计、实施和评价上都存在着不少困扰,亟需突破性的改革,学校本位的高师信息技术课程开发适应了学校发展和课程改革的需要。本文对学校本位的高师信息技术课程开发进行了初步的探索,并审视存在的困难。  相似文献   

8.
为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率, 在现有中文分词算法的基础上, 提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射, 对词库进行改造, 使之更好地与相关词进行映射, 以便于实现中文分词。实验证明, 改进的中文分词算法能降低检索耗时, 是已有的分词算法的1/2和1/5, 有效提高中文全文检索的速率。  相似文献   

9.
以图书馆的常见问题为基础,研究全文检索、中文分词、向量空间模型等技术,构建符合相关问题的知识库,结合云数据库设计,在微信小程序平台运用JavaScript,WXML,WXSS,Python等开发语言和Flask框架,实现一个基于微信小程序的图书馆智能客服系统,其中的智能回复模块实现了全文检索和中文分词等技术,以鲜明的便...  相似文献   

10.
德萨 《西藏大学学报》2007,22(2):13-17,106
藏文信息资源是祖国民族文化宝库中独具特色的一颗璀灿明珠。自古以来藏文就是藏民族文化传承的主要载体。但是,目前西藏地区大多数藏文信息服务机构由于观念、体制、法律、技术、人才、设备、资金、服务等因素制约,不能适应网络环境下用户信息服务的迫切需求,严重阻碍着藏文信息资源的可持续利用与发展。藏文信息资源正面临着能否顺利跨入信息时代的严峻考验,鉴于这种状况,文章从社会学和理论图书馆学两个角度,对网络环境下西藏地区藏文信息资源共享可行性研究的意义进行阐述。  相似文献   

11.
针对藏文信息处理的需求,提出了一套层次化、基于规则的藏文文本规范化处理方案.首先分析整理了藏文文本中的不规范文本类型,然后根据藏文文本中不同类型的不规范文本特征,分别设计文本规范化算法,并用程序实现了藏文文本的规范化.最后对该方法进行了实验测试,测试结果表明该方法能较好地实现藏文文本的规范化.  相似文献   

12.
论述了信息技术及其对企业的影响 ,企业组织希望自己的各类专业人才应具备必须的信息技术技能 ,以适应企业未来发展的需要。针对这种需求 ,本文对高校如何培养具备信息技术技能人才的有关教学内容和教学方法进行了研究 ,并提出了技能转换的概念  相似文献   

13.
随着以电子计算机技术为核心的信息技术的发展,人类社会进入信息时代。信息技术在各个领域得到了广泛的使用,信息时代的档案管理需要对大量的信息进行处理和管理,这使得传统的手工管理方式已经不能很好的适应现代化档案管理的需求,因此要对档案管理进行相应的创新,使其能够适应现代化方案管理的需求。文章紧跟时代的步伐,对现代化的档案管理进行的相关的探讨。  相似文献   

14.
文章依据所抓取的大量藏文网页URL,对相关的藏文信息网页进行除噪去重处理,得到较为完善的藏文信息库。对用户要查询的藏文信息进行预处理和藏文语义标注,通过基于本体的词汇相关性算法,扩展藏文的查询词汇,建立一对多的藏语词汇联系,从而实现藏文查询中的相关性检索,得到更加符合用户需求的语义关联网页信息。  相似文献   

15.
随着数据信息的海量增长,人们迫切需要在海量的数据中精准获取有用信息,为了解决这个问题,问答系统应运而生.现今,英文问答系统及中文问答系统取得了显著成绩,但藏文问答系统却鲜有人问津.作为一个多民族的国家,伴随信息化的高速前行,藏文问答系统的研究势在必行.文章通过对现有藏文分词、信息检索等技术分析,借用中英文问答系统成熟的模式,结合藏语语法的特殊性质,对基于FAQ库的藏文问答系统的构建进行分析研究.  相似文献   

16.
实现了中文单字切分模块,并在Lucene API基础上建立支持中英文混合检索的全文数据库。在电子文献全文检索系统项目中作为全文检索工具。中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。  相似文献   

17.
论述了信息技术及其对企业的影响,企业组织希望自己的各类专业人才应具备必须的信息技术技能,以适应企业未来发展的需要,针对这种需求,本对高校如何培养具备信息技术技能人才的有关教学内容和教学方法进行了研究,并提出了技能转换的概念。  相似文献   

18.
全文检索是基于Web的信息搜索的关键技术,文章从基于KySou的全文检索系统的实现机制入手,深入分析了全文检索系统的工作原理、系统组成及API接口设计,并就全文检索系统的优化进行探讨,包括索引过程优化和搜索过程优化。  相似文献   

19.
Lucene全文检索技术是信息检索领域广泛使用的基本技术。它是一个优秀的开源全文本搜索技术框架。按照Lucene的框架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中。首先介绍了一个高性能的全文检索引擎--Lucene开源系统,详细分析了Lucene的系统结构,程序运行逻辑,以及在Lucene上的扩展,即中文分词器的设计;然后将其引入具体应用,给出了一个基于Lucene全文检索技术的名著——《红楼梦》搜索引擎的设计与实现。  相似文献   

20.
设计实现了一个基于Lucene的全文检索系统模型.在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号