首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接.  相似文献   

2.
随着互联网的信息以指数级增长,用户希望搜索引擎能够提供面向专业的更准确智能搜索服务,主题搜索引擎的研究显得越来越有意义。本文对基于本体语义主题搜索引擎系统的关键技术进行研究。首先建立主题搜索引擎系统流程,对主题网络爬虫,网页主题相关度、网页主题分类进行了算法研究。最后以服装纺织领域的主题搜索实现为例,说明主题搜索引擎系统能更准确快速实现专业搜索服务。  相似文献   

3.
目前生物学研究十分依赖生物数据的有效性和可靠性.为了构建新的生物知识,来自不同数据源的生物数据必须集成.本文首先介绍了主要的语义网技术及其在生物学数据集成中的应用.接着分析了由于生物学数据的特殊性,语义网技术在生物学数据集成中也面临了一些挑战.最后指出了语义网技术在生物学数据集成方面研究的方向.  相似文献   

4.
垂直搜索引擎是针对某一个特定领域的专业搜索引擎,是搜索引擎的细分和延伸.垂直搜索引擎可以帮助用户在海量数据中进行快速、专业、精准的检索.文章实现了基于Lucene技术的山西高校图书垂直搜索引擎,其可以为读者提供专业的图书信息检索服务.  相似文献   

5.
目前生物学研究十分依赖生物数据的有效性和可靠性。为了构建新的生物知识,来自不同数据源的生物数据必须集成。本文首先介绍了主要的语义网技术及其在生物学数据集成中的应用。接着分析了由于生物学数据的特殊性,语义网技术在生物学数据集成中也面临了一些挑战。最后指出了语义网技术在生物学数据集成方面研究的方向。  相似文献   

6.
随着数字化信息的急速增长,如何使人们快速地从数据的海洋里找到自己最需要的信息,已经成为急需解决的问题。搜索引擎是人们获取信息的重要手段,语义网又是因特网未来的发展方向,因此基于语义网的信息检索是语义网相关研究的重要内容。  相似文献   

7.
阐述了目前网络上的搜索引擎主要是基于关键词索引查询技术而设计的,这种技术的搜索范围很大,但由于关键词难于表达丰富的概念和用户信息需求中的丰富语义,导致查准率很低。以语义W eb和基于语义的网络信息检索技术为理论根据,从克服目前信息组织和信息检索的矛盾出发,用XML/RDF作为语义描述、组织、存储、查询的工具,试图在未来搜索引擎发展方面做一些尝试性的研究,提出了一个基于自然语言查询的搜索引擎模型。  相似文献   

8.
针对目前搜索引擎返回的信息量过大且缺乏语义关联等问题,提出了一种云计算环境下的可视化探索式搜索引擎模型.该模型通过对元搜索引擎返回的原始信息在云计算环境下语义相似度的计算和语义链的构建,采用探索式搜索方法为用户获取个性化的结果.与传统搜索引擎相比,其结果更加直观地表现了目标信息及其之间丰富的语义关系,该方法使用户能够更为自然而有效地在海量的信息中发现更符合其需求的目标.作为实验模型,还需要更多的元搜索引擎的支持,以及进一步计算优化语义相似度的算法,才能使该模型真正实用化.本研究为云计算环境下构建新一代个性化智能搜索引擎提供了理论和实践上的参考.  相似文献   

9.
Web网上大量的异构、非结构化的数据使人们难以有效地发现自己所需信息. 通过利用元数据和本体语义特点,借助Web服务技术,提出构建元数据登记库MDR和本体管理系统OMS,在分布式闭包生成基础上进行推理,实现基于本体表示语言RDF特性的Web数据搜索引擎SBWSE,达到分布异构环境下高效发现信息的目的,解决了基于关键词的搜索引擎所表现的查全率和查准率不佳问题.  相似文献   

10.
介绍了互联网上生命科学信息资源的获取方法,包括生物学数据库、搜索引擎、专业网站、研究机构、大专院校、学术机构、电子论坛等网站的网址、内容及其基本检索方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号