首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
李强 《甘肃科技》2012,28(3):27-29
Internet的发展,为我们提供了海量的信息资源,但由于Web的复杂性,目前传统的搜索引擎只能检索出其中一部分信息.大量的隐藏信息对这些搜索引擎是不可见的.这些信息隐藏在Web页面的搜索表单中,存在于大型的数据库.用户必须通过查询其后端的数据库才能获得这些Deep Web信息.首先介绍了Deep Web引擎的一般原理,列举了目前Deep Web的流行技术,以及Deep Web搜索引擎的研究现状,并给出了Deep Web搜索引擎的完整实现内容框架,同时探讨了数据库自动发现、数据库自动选择、返回结果自动抽取、结果聚合等4个实现Deep Web搜索引擎的关键技术.  相似文献   

2.
本文提出一个新的Web搜索引擎框架GSE,并提出了一个适应Web信息获得与处理的语言WIRPL,通过WIRPL可以将多个Web搜索引擎结合起来,为用户提供一个一致高效准确的Web搜索引擎。  相似文献   

3.
WEB搜索引擎关键技术研究   总被引:1,自引:0,他引:1  
随着WWW的飞速发展,网络搜索引擎已经成为广大用户获取网络信息的主要检索工具。本文在阐述Web搜索引擎的工作原理基础上,深入研究了网页搜集、网页内容分析和链接分析、索引技术、检索技术等构建搜索引擎的关键技术,最后探讨了衡量Web搜索引擎的主要性能指标。  相似文献   

4.
随着互联网用户的不断增多以及搜索引擎的广泛使用,用户间进行协同Web搜索的行为不断增多,然而目前的主流搜索引擎和Web浏览器均针对用户的单独搜索行为设计,不便于进行协同Web搜索。在回顾相关研究的基础上,通过对Web搜索引擎的发展分析,指出存在两种实现协同Web搜索的方式,提出了一种基于CBR(case-based reasoning)的协同Web搜索模型,并介绍了基于此模型实现的两套协同Web搜索原型系统。  相似文献   

5.
Web页面相关度算法   总被引:1,自引:0,他引:1  
元搜索引擎是建立在独立搜索引擎之上的搜索技术,而Web页面相关度算法是元搜索引擎的核心技术之一.文中在文档价值预测模型(DVPM)的基础上,将Web页面分解为不同的属性,通过属性值的计算来预测Web页面的相关度,给出了相关度的计算公式与评价,进行了相关度算法的实验研究.结果表明,该算法提高了Web页面的准确度.  相似文献   

6.
提高搜索引擎检索结果的精度并向用户提供个性化信息查询服务已经成为搜索引擎技术的一个研究热点.搜索引擎个性化信息查询服务技术有Web挖掘技术、基于移动Agent的个性化信息服务技术等,介绍了基于Web挖掘的个性化技术的发展趋势.  相似文献   

7.
随着Web信息的急剧增长,搜索引擎越来越受到人们的重视。本文阐述了搜索引擎的概念、分类、工作原理,讨论了搜索引擎存在的问题以及其未来的发展趋势。  相似文献   

8.
Web挖掘技术的应用之一就是Web搜索引擎。对于搜索引擎中的Web结构挖掘,通过对经典的超链接分析算法的研究,对Web超链结构进行深入分析的基础上,针对HITS算法的缺陷,通过引入权值和调整因子对其进行改进。实验表明,改进后的算法表现更加出色。  相似文献   

9.
在互联网高速发展的今天,搜索引擎逐渐成为用户在Web上获取信息的主要工具。传统的通用搜索引擎利用一个Crawler程序面向整个Web进行信息采集,它的缺点是采集无针对性、页面失效率高、不能满足特定专业人群的需要。针对这种情况,需要一个分类细致精确、数据全面深入、更新及时的面向主题的搜索引擎。  相似文献   

10.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接.  相似文献   

11.
分析了Web检索引擎的工作原理,介绍了一个校园网Web搜索引擎原理,并给出实现中的关键技术。文中所介绍的校园网Web搜索引擎框架具有单项和多项组合全文检索的特性,可实现检索空间的限定。该原型系统已应用于校园网搜索引擎的设计中,并取得了较好的效果。  相似文献   

12.
随着Internet的发展,Web上大量、分布、动态的信息导致了"信息过载",传统搜索引擎面临严峻的挑战。目前对MobileAgent系统的理论与应用研究已成为一个热点前沿课题。本文对Web搜索引擎中MobileAgent动态路由问题进行了研究。  相似文献   

13.
商友忠 《科技信息》2007,(15):104-105
Web信息的急剧增长使搜索引擎专用化成为发展趋势。重点论述了主题搜索引擎的信息采集策略,并给出了一种比较理想的建筑业信息搜索引擎设计方案。  相似文献   

14.
赵静 《甘肃科技》2012,(23):10-14
针对高校学术信息资源检索的精确度问题,提出了运用Web挖掘的高校图书馆搜索引擎系统。它主要对Web使用记录挖掘及其用户兴趣模型的建立进行了详细分析。首先它阐述了高校图书馆搜索引擎系统的4个过程,其中主要提出建立用户兴趣模型时采用的一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法;然后阐述了高校图书馆搜索引擎系统的各处理模块;最后设计了结合Web数据挖掘的高校图书馆搜索引擎系统操作过程,保证了所创建的用户兴趣模型的准确性,从而有效地提高高校图书馆搜索引擎系统的查准率。  相似文献   

15.
为了快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用,采用搜索引擎技术,借鉴Web挖掘技术解决用户检索网络信息的困难。同时探讨搜索引擎技术在网络信息挖掘方面的应用,重点研究网络爬行器技术,给出了Linux下Java语言实现简陋Web爬虫代码。研究结果表明对于搜索引擎而言,通过借鉴Web挖掘技术,可以提高查准率和查全率,改善检索结果的组织,增强检索用户的模式研究,从而使得检索效率得到改善。该成果对Web信息挖掘有一定参考价值。  相似文献   

16.
通过阐述Web知识挖掘:搜索引擎的现状、原理及分类,指出了传统搜索引擎存在的不足,介绍了一种基于概念搜索的Web知识挖掘:智能搜索,并对其原理及基本实现进行了简要说明.在此基础上,提出了智能搜索的研究动向.  相似文献   

17.
用户在Web 上检索信息时,通常使用门户网站所提供的搜索引擎工具,但目前的搜索引擎普遍存在查全率和查准率低、不具备个性化等问题.论文对新一代个性化智能搜索引擎的主要技术进行了研究,提出了智能搜索引擎的总体框架,详细介绍了原型系统--新闻搜索引擎的实现以及其中用到的关键技术.  相似文献   

18.
校园内网搜索引擎构建的必要性分析   总被引:1,自引:0,他引:1  
鲁屹华 《科技资讯》2012,(2):13-13,15
分析了当前通用搜索引擎的原理和体系结构,研究了通用搜索引擎在应用于校园网信息检索时无法完整准确的不足之处以及校园网Web信息的特点,总结了校园网搜索引擎应该具有特性以及建设的必要性。  相似文献   

19.
借助浏览器插件技术可以弥补主流搜索引擎无法有效利用用户搜索经验的不足,可更好地实现个性化Web搜索。为此提出一种新的个性化Web搜索模式,即搜索引擎-浏览器插件-推荐引擎模式,给出一种基于案例推理的个性化Web搜索推荐系统体系结构,探讨了搜索经验的获取、表示与组织等,介绍了案例模型的基本结构。此外,介绍了基于上述模式开发的ExpertRec原型系统。  相似文献   

20.
构建图像Web搜索器是实现基于内容Web图像搜索引擎系统的关键,运行搜索器可为引擎系统提供Inter-net上的图像数据源.提出了一种基于内容的Web图像搜索引擎的Web搜索器,它从初始URL网址集出发,根据广度优先遍历策略来获取新的URL网址以及互联网中图像文件信息,并建立Web图像特征库.实验表明,当搜索器在设置较多父URL图像网址以及适合的遍历层数时,可获得图像信息检索的最佳性能,可获得较多数量网络图像信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号