首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
智能信息检索代理结构   总被引:2,自引:0,他引:2  
信息过载已成为Internet用户信息检索时的最大难题,利用智能信息检索代理技术可解决这些问题.在对智能代理特征(主要包括智能搜索,导航向导,自动通告,个人信息管理,动态个人化网页,以及页面辅助阅读工具等)进行分析的基础上,参照模块化的代理结构,讨论了智能Agent的各组成模块功能和各个模块在实现不同功能时的组织方法.经过初步实践表明,智能Agent用于提高信息检索效率和减小网络信息过载是可行和有效的.  相似文献   

2.
随着互联网的信息以指数级增长,用户希望搜索引擎能够提供面向专业的更准确智能搜索服务,主题搜索引擎的研究显得越来越有意义。本文对基于本体语义主题搜索引擎系统的关键技术进行研究。首先建立主题搜索引擎系统流程,对主题网络爬虫,网页主题相关度、网页主题分类进行了算法研究。最后以服装纺织领域的主题搜索实现为例,说明主题搜索引擎系统能更准确快速实现专业搜索服务。  相似文献   

3.
盛秋艳 《应用科技》2004,31(11):45-47
介绍了一个基于Agent的网络搜索子系统,该系统通过查询代理与Internet上的搜索引擎实现连接,既可实现元搜索,又可以在返回的网址较少或不满足用户的要求时,使用自身搜索工具在网络上自主搜索,而且搜索算法从查询代理返回的网址出发进行搜索,减少了搜索的范围,加快了搜索的速度.  相似文献   

4.
提出了一种基于搜索代理的自动提取和分析纺织企业信息的搜索系统。该搜索代理以搜索引擎技术为核心,结合用户反馈信息和专业领域词汇,对特定领域进行划分,同时利用网页结构特征信息剖析有价值内容,并将提取的信息置于数据库中,以进行广泛应用。  相似文献   

5.
介绍面向侨务信息主题搜索引擎的工作原理和体系结构,根据侨务信息的特征对网页进行侨务信息的识别.针对主题式搜索,提出一种优化的,基于历史反馈(BHF)的搜索策略,并对该搜索策略进行实验测试.结果表明,以该方法设计的面向侨务信息主题的搜索引擎系统,具有较高的搜索速度与识别精度.  相似文献   

6.
对Web教学资源自动搜索系统进行了总体设计,系统引入了智能分词技术,并在搜索模块采用了改进的PageRank算法,有效地解决了传统搜索引擎在教育资源领域方面存在检索精度不高、信息反馈量过大的问题。  相似文献   

7.
电子政务系统引入"主题智能公文包"服务的研究   总被引:1,自引:0,他引:1  
利用数理统计、知识推理原理,采用智能代理、信息推送等技术,提出在系统内建立利于用户自身习惯的方便快捷的信息定制服务(即主题智能公文包)功能模型.通过该模型,用户可以获得即时、主动、个性化的信息服务,并且能够便捷地获取所需信息.  相似文献   

8.
分析了网络服务平台的技术特点,探讨了基于Web技术的服务平台的设计思路以及主要技术的实现方法,构造了一个基于Web的学校勤工助学服务系统。该系统分为两部分:一部分对申请和提供勤工助学的信息进行资源整合,由后台数据库操作与管理;另一部分进行服务流程的重新设计,可实现注册/登录、最近新闻的提示、浏览与搜索查询、数据采集与存储、网上预订与处理等功能。该系统的实际制作过程中,除了对网站的外观进行设计以外,还对资料进行创建并让网站内的网页与数据库相结合,将网页与网站服务器上的数据创建连接,并且可以更新网页上的内容。  相似文献   

9.
运用多代理系统进行远程教学系统设计,是智能教学系统(Intelligent Tutoring System,ITS)的一个重要研究方向,目前很多面向远程教育方面的研究中,有很多对代理和智能多代理的研究和运用.但对代理之间的协调、调度研究不多.文中利用智能多代理技术,针对采用客户——服务器模式的协同式智能教学的远程教学系统平台,设计了多个代理之间的竞争模式,通过交互式智能多代理和网络的融合机制,实现了远程网络教学的有关交互式功能.  相似文献   

10.
ASP网页中应用ADO实现数据库连接   总被引:3,自引:0,他引:3  
随着网络技术的飞速发展,承载着网络中信息传递主要功能的网页技术也在发生着重要的变化,从最初的HTML静态页到动态网页,从C/S(客户机/服务器模式)到B/S(浏览器/服务器模式)。网页技术与数据库的结合使用已经成为网页技术发展的主要方向,现在网络中我们常用的BBS论坛、电子商务、信息检索系统均要使用数据库存储交互所需要的数据。本文探讨了基于ASP动态网页应用ADO实现数据库连接的方法。  相似文献   

11.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

12.
Focused crawlers are important tools to support applications such as specialized Web portals, online searching, and Web search engines. A topic driven crawler chooses the best URLs and relevant pages to pursue during Web crawling. It is difficult to deal with irrelevant pages. This paper presents a novel focused crawler framework. In our focused crawler, we propose a method to overcome some of the limitations of dealing with the irrelevant pages. We also introduce the implementation of our focused crawler and present some important metrics and an evaluation function for ranking pages relevance. The experimental result shows that our crawler can obtain more "important" pages and has a high precision and recall value.  相似文献   

13.
利用Apriori算法对Deep Web网站中最大频繁关联关系网页进行识别,并对非最大频繁项网页进行剪枝,再遍历Deep Web网站网页,从而获取所有最大频繁关联关系网页。对某房地产Deep Web网站的实验结果验证了该算法的可行性和有效性。  相似文献   

14.
针对传统Web缓存技术不能加速动态页面传输的局限性,提出了一个新的动态页面缓存加速算法,实现对动态页面的网络传输加速功能,并且在现有的缓存加速系统squid上实现了该算法,最后对其进行了测试和结果分析.  相似文献   

15.
采用计算向量之间相似度的方法, 通过实验分析验证了表格信息在主题爬行中的重要性. 研究结果表明, 与整个网页相比, 表格所能提供的与用户相关的信息占整个网页信息总量的80%以上, 因而在主题爬行领域可以充分利用这一结论进行网页解析. 在舍弃除表格和标题之外的其他元素后, 提高了爬行程序的效率.  相似文献   

16.
提出了一种基于噪音清除的网页削重算法.首先应用空间向量模型,仅仅使用<特征词,权重>二元组表示网页,降低削重算法的时空复杂度;其次,通过一组启发式规则来消除网页中包含的“噪音”,消除了无关信息对网页核心内容的干扰.  相似文献   

17.
一种基于块分析的网页去噪音方法   总被引:2,自引:1,他引:2  
一张网页通常由许多信息块组成,除了主题内容块以外,还常常包含广告信息、导航条、版权信息等信息块。结合网页块大小、位置等信息以及网页本身的一些特点,提出了一种基于块分析的、自动调整阈值的去除噪音方法,该算法显著减少了网页的噪音,并通过网页分类对比实验证明了该算法的有效性。  相似文献   

18.
利用超链接信息改进网页爬行器的搜索策略   总被引:5,自引:0,他引:5  
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题相关的网页超过50%.  相似文献   

19.
The Web cluster has been a popular solution of network server system because of its scalability and cost effective ness. The cache configured in servers can result in increasing significantly performance, In this paper, we discuss the suitable configuration strategies for caching dynamic content by our experimental results. Considering the system itself can provide support for caching static Web page, such as computer memory cache and disk's own cache, we adopt a special pattern that only caches dynamic Web page in some experiments to enlarge cache space. The paper is introduced three different replacement algorithms in our cache proxy module to test the practical effects of caching dynamic pages under different conditions. The paper is chiefly analyzed the influences of generated time and accessed frequency on caching dynamic Web pages. The paper is also provided the detailed experiment results and main conclusions in the paper.  相似文献   

20.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号