首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节.实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性.实现了教育资源的共享,具有较高的应用价值.  相似文献   

2.
根据校园舆情和信息安全管理的需要,结合垂直搜索的特点,提出了一种面向主题的域内垂直搜索引擎模型.给出了模型在信息采集、分词处理、主题识别、网页索引、检索处理5个功能模块的实现过程,并对模型涉及的中文分词方法、隐形关键词组的扩展运算、检索正态化因子的调整等关键技术进行了讨论.建成的搜索引擎能够很好地满足用户主题检索服务的需要.  相似文献   

3.
中文农业主题搜索引擎的设计与实现   总被引:2,自引:1,他引:1  
用户对农业信息的需求越来越多,农业搜索引擎的开发变得十分必要.从农业搜索引擎发展状况出发,在分析研究通用搜索引擎工作原理、系统架构的基础上,设计并实现了中文农业主题搜索引擎,给出了开发过程中采用的关键技术.结果表明,能满足用户实际需求.  相似文献   

4.
随着网络与通信技术的迅速发展,为了满足人满对特定领域信息的个性化需求,更具有针对性的垂直搜索引擎应运而生。本文介绍了垂直搜索引擎,并对垂直搜索引擎的核心技术垂直网络蜘蛛技术和信息抽取技术作了介绍,最后进行了总结和展望。  相似文献   

5.
刘红梅 《科技信息》2013,(24):252-253
主题爬虫是垂直搜索引擎的关键构建,其搜索算法的优劣直接影响到搜索引擎的查全率和查准率。本文简要介绍了垂直搜索引擎中主题爬虫的工作原理;归纳了常见的几种搜索策略算法;分析了主题爬虫的搜索策略的特点,并比较了几种搜索策略的优缺点;总结了提高主题爬虫搜索效率的关键因素及发展趋势;为后期的学习和研究打下基础。  相似文献   

6.
金鹏 《科技信息》2010,(20):222-223
由于民用搜索引擎无法在军队中使用,随着部队人员对提供的各项信息服务的要求越来越高、越来越细,基于整个Web的信息采集越来越力不从心.同时它也无法迅速地搜集到足够的最新的网络信息,也不能满足人们日益增长的个性化需求.本文希望通过开发一个军事教育类主题方面的爬虫以满足用户专门检索军事教育类信息的要求.  相似文献   

7.
垂直搜索引擎是针对某一个特定领域的专业搜索引擎,是搜索引擎的细分和延伸.垂直搜索引擎可以帮助用户在海量数据中进行快速、专业、精准的检索.文章实现了基于Lucene技术的山西高校图书垂直搜索引擎,其可以为读者提供专业的图书信息检索服务.  相似文献   

8.
在互联网时代,随着信息量的不断膨胀,搜索引擎在计算机技术不断发展的局势下,受到了更多的挑战。本文就搜索引擎的发展历程及结构原理进行了介绍,重点提出如何利用Java语言对垂直搜索引擎进行设计方案的构建。  相似文献   

9.
基于概念分析的主题爬虫设计   总被引:1,自引:0,他引:1  
研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.  相似文献   

10.
主题爬虫是垂直搜索引擎的核心组成部分,它为面向主题的用户查询准备数据资源;提出了一种基于HMM的主题爬虫方法,方法不仅分析网页内容,而且还考虑网页的上下文链接结构,首先将当前网页的聚类结果作为观察状态、将当前网页到目标网页的链接距离作为隐含状态,然后通过HMM模型学习用户的主题浏览模式并利用它采集更多的主题网页;实验结果表明:方法能采集大量与指定主题相关的高质量网页,主题爬行效率优于Best-First主题爬虫。  相似文献   

11.
介绍面向侨务信息主题搜索引擎的工作原理和体系结构,根据侨务信息的特征对网页进行侨务信息的识别.针对主题式搜索,提出一种优化的,基于历史反馈(BHF)的搜索策略,并对该搜索策略进行实验测试.结果表明,以该方法设计的面向侨务信息主题的搜索引擎系统,具有较高的搜索速度与识别精度.  相似文献   

12.
主题蜘蛛的设计与实现   总被引:1,自引:0,他引:1  
针对多媒体资源在网上的分布特点,采用链接类型过滤、网页内容过滤、链接内容过滤三层过滤和临时页面存储、目标页面存储、中间链接存储、更新存储四层存储机制,设计并实现了一个对包含多媒体资源(音频、视频和Flash动画)的网页进行搜集的主题蜘蛛.实验结果显示,该主题蜘蛛能有效提高查准率.  相似文献   

13.
研究了普通搜索引擎技术特点和实现过程,系统地分析比较研究基于主题改进爬虫程序算法,设计实现一个能更好地满足用户不同搜索需求的主题搜索引擎,该搜索引擎具有科学性、高效性、实用性、易操作性等优点.使用本搜索引擎,对多个大型网站进行查询搜索,通过实验数据对比,结果表明,该引擎的数据查全率和查准率都高于普通搜索引擎,具有较高的...  相似文献   

14.
本文阐述了搜索引擎和主题网着的工作原理,并对这两种搜索方式进行了比较分析。  相似文献   

15.
为了弥补互联网信息爆炸带来的搜索引擎用户满意度低的问题,提出了一种基于本体的垂直搜索引擎模型。该模型构建一个本体知识树,利用增加了属性提取和相似度算法的NWeb-Crawler对网页进行抓取,并将非相关信息进行隔离;然后,进行网页源代码格式信息和语义信息两方面的抽取;抽取的数据信息通过分词后建立二维索引表,用户的请求通过本体知识树扩展概念集和二维索引表进行检索。该系统模型从入口网页到出口数据逐步贴近检索需求,具有良好的扩展性,对垂直搜索引擎的研究有一定的参考借鉴作用。  相似文献   

16.
高校图书馆重点学科垂直搜索引擎初探   总被引:1,自引:0,他引:1  
简要介绍了垂直搜索引擎与普通搜索引擎相比所具有的特点,阐述了高校重点学科建设的迫切性,探讨了垂直搜索引擎在图书馆重点学科建设中的应用,提出了基于垂直搜索技术的重点学科主题搜索引擎方案。  相似文献   

17.
本文设计了一个基于垂直搜索引擎技术的旅游线路评价推荐模型系统。该系统首先采用垂直搜索引擎技术针对旅游行业网站抓取特定信息,提取旅游路线及相关旅游资讯信息,并辅以人工资讯录入方式,建立旅游路线、旅游资讯数据库。  相似文献   

18.
基于专业搜索引擎的元搜索引擎的设计   总被引:1,自引:0,他引:1  
介绍了一个基于专业搜索引擎的元搜索引擎,提出将专业搜索引擎与专门搜索“Invisible Web”检索工具相结合的方法.在对检索结果进行融合处理时,采用建立专业词典的方法来提取主题,并进行主题的分类.同时,通过记录用户感兴趣的主题,为用户提供个性化服务.  相似文献   

19.
本文从搜索引擎的概念入手,对搜索引擎技术进行分类,并且详细介绍了互联网搜索引擎技术的工作原理及过程,最后预测了未来搜索引擎技术的发展方向.  相似文献   

20.
随着互联网竞争日趋激烈,垂直搜索引擎技术日渐发展。本文从军事工程兵的角度出发,对垂直搜索引擎进行系统研究,研究表明垂直搜索引擎具有很强针对性、智能性和实时性,其应用价值更为突出。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号