共查询到20条相似文献,搜索用时 949 毫秒
1.
企业搜索引擎安全搜索的研究 总被引:1,自引:0,他引:1
企业搜索引擎的应用给企业带来了方便的同时也带来了相当大的安全问题,安全搜索是企业搜索管理技术中的重中之重,分析搜索引擎介入从而产生的安全性问题,针对企业中信息系统数量多、结构繁杂、数据量大、安全性高等特点提出一套多级授权访问控制机制。在这套机制基础之上能够很好地解决现阶段企业搜索引擎面临的安全问题,不仅可为实现企业搜索信息安全提供理论指导,还为实现企业搜索安全体系框架提供了依据。 相似文献
2.
为解决传统搜索引擎个性化的局限性问题,在研究用户感兴趣搜索引擎现状基础上,通过多Agent较全面记录、分析用户搜索的行为,提出了一种新的综合用户搜索行为,构建用户感兴趣搜索引擎研究框架--基于多Agent搜索行为分析的用户兴趣模型。研究结果表明,依据用户搜索行为构建用户兴趣模型,使搜索引擎返回结果更贴近用户需求。满足用户个性化服务,提高了信息搜索的查全率和查准率。 相似文献
3.
《华东师范大学学报(自然科学版)》2017,(5)
大数据时代,从海量的数据中发现对用户有用的知识成为研究领域重要的问题.通过集成多个搜索引擎的查询结果,实现食品安全领域中搜索信息的集成和个性化自适应排序.本文设计基于元搜索技术、知识本体和自适应的排序学习技术,实现多个搜索引擎相关查询结果集成,在对用户点击的标注和知识本体的基础上,利用基于监督学习的排序技术,实现对食品安全领域信息的个性化自适应排序.系统实现了集成多个搜索引擎的食品安全相关知识的提取和相关结果的重新排序.本研究不仅实现了多个搜索引擎食品安全信息查询相关的结果集成,而且能够根据用户的偏好实现结果的自适应排序. 相似文献
4.
元搜索是一种基于搜索引擎的搜索引擎,它将各个独立搜索引擎的结果经过融合呈现给用户,以此为用户提供更加全面的信息,但是要在数量庞大的搜索结果中快速的找到自己所需要的信息却不是一件容易的事。本文提出了一种基于用户兴趣的个性化元搜索引擎模型,通过提取用户个性化行为特征,建立用户兴趣库,并对搜索结果进行合理排序和整合,将用户最感兴趣的信息尽可能排在最前面,从而实现元搜索的个性化,提高用户搜索的查准率和效率。 相似文献
5.
步入信息化时代,人们获取信息的主要方式就是通过网络。Internet上的信息量不断更新增多,虽然为人们提供了丰富的信息资源,但是却也加大了人们搜索所需信息的难度。一些搜索引擎,诸如百度、Google等虽然提供了网页搜索的便捷方式,但由于关键词的匹配是信息检索技术的基础,因此搜索结果往往存在冗余及多余无用信息,搜索匹配准确率不高。如何在浩瀚如海的信息空间里快速、准确的查找到所需信息,是目前人们关注的焦点问题。 相似文献
6.
针对网络上各种信息混杂、信息传播速度快、有害信息混杂其中、网络舆情治理难的问题,为及时搜索网络信息提供一个搜索服务平台。实现了基于ElasticSearch为搜索引擎,提供通过关键字搜索舆情信息的服务,并使用JavaWeb技术进行功能的实现。该平台同时具有实用性和可扩展性,对于类似的搜索平台有着借鉴意义。 相似文献
7.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。 相似文献
8.
web搜索是因特网上非常有用的信息检索工具,但是由于目前搜索引擎检索出的信息庞大,且一个特定的搜索引擎主要包含某一特定领域的信息,这使得用户很难获得准确的导航信息,为此本重点介绍了AltaVista和Yahoo等当今流行的两种搜索引擎,并对它们各自的优点和功能进行了分析。通过时它们的分析揭示了目前网上搜索引擎所面临的问题,由此介绍了一种新的web搜索引擎——元搜索引擎,最后介绍了适合于Web信息获取与处理的WIRPL语言以及搜索引擎使用的一些技巧。 相似文献
9.
10.
针对通用搜索引擎在当前网络搜索应用中出现的搜索结果冗余度过大、信息定位不准确的问题,对垂直搜索引擎进行了研究,剖析了通用搜索引擎和垂直搜索引擎的体系结构,比较了两者的工作流程和搜索结果进行,利用垂直搜索引擎专注于某一领域从而降低了"一词多义"现象的特性,有效提高了查全率和查准率。针对垂直搜索引擎在无法满足不同用户的个性化需求方面的不足,分析了垂直搜索引擎的个性化信息检索和推荐技术,然后从实际应用出发,设计和实现了基于用户和文档特征向量矩阵的个性化检索和推荐算法。 相似文献
11.
随着Web技术的飞速发展,海量数据的管理与搜索变得尤为重要。海量信息的异构性和动态性特点要求信息集成需要Web爬虫来自动获取这些页面,以便进一步处理数据。而一些企业内部的资料既要保密又要供不同的内部职员使用,这种既开放又保守的特点成为企业发展的瓶颈。为了帮助用户完成这样的任务,本文改变传统的资源共享形式,为企业提供了一个高效便利保密的资源共享管理平台——企业搜索引擎(ESE),提出了一种基于主题式爬虫的Deep Web页面的企业搜索引擎(ESE)的和基于开源Java Lucene的索引企业搜索系统设计与实现方法。通过在电信行业Deep Web站点部署实验,经运行检验,结果达到了设计指标要求,为电信行业搜索发挥了作用。并对搜索的精度、速度,以及垃圾网页反舞弊等方面研究进行了展望。 相似文献
12.
13.
14.
史维 《科技情报开发与经济》2010,20(11):84-87
搜索引擎是人们使用Internet信息资源的重要工具。对目前的搜索引擎进行了简要的分析,以百度搜索等为例,详细介绍了相关网络信息检索工具以及如何在短时间内能够掌握利用和运用Internet的资源找到人们所需要信息的方法。 相似文献
15.
随着互联网信息多样化和爆炸式的发展,人们面临着"信息迷航"和"信息过载"的困扰;当代社会对信息检索的需求不仅仅局限在通用搜索引擎,更需要针对特定领域设计出个性化搜索引擎。通过分析研究网络搜索引擎的组成结构及利用Lucene构建搜索引擎的方法,在Lucene原有网页排序算法基础上,结合PageRank算法的思想和用户喜好权重,提出更具个性化的网页排序算法,以反馈给用户符合其个性化需求的搜索结果。在.Net开发平台,利用C#语言,结合几种开源API,完成了个性化网络搜索引擎系统的设计与实现。系统界面设计采用了XAML及Ajax技术,搜索结果显示模块采用异步传输技术,使用户界面更加友好。通过测试和分析,系统实现了个性化搜索,用户不翻页也可以查看全部搜索内容,用户的体验度得到了提升。下一步将增加爬虫对于网络错误信息的处理及对于病毒网站的过滤功能。 相似文献
16.
17.
介绍面向侨务信息主题搜索引擎的工作原理和体系结构,根据侨务信息的特征对网页进行侨务信息的识别.针对主题式搜索,提出一种优化的,基于历史反馈(BHF)的搜索策略,并对该搜索策略进行实验测试.结果表明,以该方法设计的面向侨务信息主题的搜索引擎系统,具有较高的搜索速度与识别精度. 相似文献
18.
WWW环球信息呈指数级增长,使WWW成为全球最大的信息系统,研究其中的信息搜索工具具有现实意义.WebRobot是搜索引擎中的核心部分,它从给定的统一资源地址开始分析,递归地搜索新的Web文档.作者论述了WebRobot的工作原理以及机器人排斥标准,用Java实现了Web文档的下载、超链提取、新超链的可用性判断和访问站点的安全性检查,为提高WebRobot的效率提出了2种解决途径,即采用Java多线程处理技术和集群式Robot.此外,给出了用Java多线程处理技术提高效率的算法,对网站建设和信息搜索工具的开发具有一定的参考价值. 相似文献
19.
20.
基于Ajax的聚合搜索系统 总被引:1,自引:0,他引:1
随着Internet的发展,人们对于信息的需求与日俱增。而且,人们倾向于应用多个搜索引擎以获取更全面、准确的信息。因此,作为崭新的搜索方式,将各大搜索引擎集中到一个平台的聚合搜索开始备受关注。针对这种应用趋势,文章介绍一个基于Ajax的聚合搜索系统的实现过程,它以百度、Google、雅虎、爱问、搜狗、中搜6大搜索引擎作为搜索源,利用正则表达式匹配搜索结果,最终给用户呈现一个整洁的搜索结果。 相似文献