首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
循证医学信息化若干关键技术的研究   总被引:1,自引:1,他引:0  
由于Web信息检索返回页面的数量巨大,对搜索结果进行排序成为影响搜索质量的一个重要问题.分析了搜索引擎Google采用的PageRank算法,指出其具有偏重旧网页和忽视专业站点的不足,考虑网页日期这一重要因素改进了PageRank算法,试验结果表明,改进的算法可以提高判断网页重要性的准确度.最后介绍了如何通过个性化服务来发现与用户兴趣相似的资源.  相似文献   

2.
提出一种基于语义Web的信息检索模型,它能够实现准确高效的网络信息检索,克服传统信息检索的局限。介绍了语义Web、本体以及Lucene全文检索技术,详细阐述该模型的六大模块,其中在本体基础之上充分利用Jena查询和推理技术进行查询扩展,以及Lucene技术来建立索引和检索,改进排序算法使得返回结果更加满足用户需求。  相似文献   

3.
对分布式信息检索的结果集采用模糊积分进行了融合,推导并给出了分布式信息检索的模糊积分算法.该算法可利用模糊积分的单调性,通过计算各信息源的模糊度量值采融合结果集并且评价排序效果.在实际的Web环境中针对4个搜索引擎算法进行了测试,结果发现,经模糊积分后的算法能较好地平衡合唱效应和黑马效应,并能获得更好的信息融合结果.在相同的条件下,所提算法在前100篇文档的排序中所荻得的相关文档数比Borda Count算法多3~4篇,比ComMIN算法多7~8篇.  相似文献   

4.
摘 要 Nutch的排序机制使得一些传统的高质量的页面经常出现Web检索结果的前面,而新加入的高质量的Web页面很难被用户找到。针对传统基于链接算法中对新内容的迟钝性,本文提出了对网页的补偿算法,对Web上在一段时间内好的资源信息使其排名结果上升,而对于不好的资源使其下降,以此来加速优质内容的传播和网络内容的合理化。并最终把改进后的算法应用在基于Nutch的搜索引擎中,通过实验来验证和测试。  相似文献   

5.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣,这种兴趣程度可以通过用户对Web站点上页面的浏览顺序及页面上的浏览时间表现出来.通过对Web用户访问路径的分析,提出一种基于浏览路径及浏览时间的相似度的度量方法.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader聚类算法Web用户的有效性.  相似文献   

6.
张佳  梁少华 《科技信息》2007,(2):20-20,53
Web结构挖掘是对Web页面之间的结构进行挖掘。挖掘对象主要是页面的超链接结构,这种结构为人们增强对网页的分析处理提供了极大的帮助。本文对基于超链接的Web结构挖掘进行了概述,并对其主要算法PageRank进行了研究。  相似文献   

7.
针对传统Web缓存技术不能加速动态页面传输的局限性,提出了一个新的动态页面缓存加速算法,实现对动态页面的网络传输加速功能,并且在现有的缓存加速系统squid上实现了该算法,最后对其进行了测试和结果分析.  相似文献   

8.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

9.
针对目前Web信息庞杂无序和半结构化特征所带来的信息检索质量低下的问题,在基于查询意图分类研究的基础上,提出了一种结合定题检索的启发式Web信息检索方法;在该方法中,Web信息检索采用一次预处理两次检索机制,根据该机制设计了Web信息检索模型,详细讨论了该模型的设计思想、关键技术和算法描述;通过仿真实验对该方法进行了测试和分析,测试结果表明该方法能够有效提高信息检索性能,在一定程度上满足用户个性化的查询需求。  相似文献   

10.
基于Agent的个性化智能Web信息检索   总被引:2,自引:2,他引:0  
介绍了Web信息检索的定义,并对web信息检索的原理、技术进行分析,针对存在的问题,结合智能Agent技术、神经网络、最好优先算法、信息过滤、相关反馈等多种算法,提出了一个基于Agent的个性化智能Web信息检索系统模型。  相似文献   

11.
基于超链接分析搜索引擎页面排序算法的剖析   总被引:1,自引:0,他引:1  
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。  相似文献   

12.
针对目前搜索结果个性化排序算法中的用户兴趣模型构建难、相关度计算不精确等问题,提出了一种结合用户兴趣模型和协同推荐算法的个性化排序方法.该方法从用户的搜索历史,包括提交查询、点击相关网页等反馈信息来训练用户的兴趣模型,然后采用协同推荐算法获取具有共同兴趣的邻居用户,根据这些邻居对网页的推荐程度和网页与用户的相关程度来排序搜索结果.实验结果表明:该排序算法的平均最小精确度比一般排序算法提高了约0.1,且随着用户邻居数目的增长,最小精确度随之增长.与其他排序算法相比,采用协同推荐算法有助于提高网页与用户兴趣关联程度计算的精确度,从而提高排序的效率,有助于改善用户的搜索体验.  相似文献   

13.
网页作弊与反作弊技术综述   总被引:1,自引:0,他引:1  
随着网络信息爆炸式的增长,搜索引擎成为人们首选的获取信息的主要途径。能否在搜索引擎的排名中占有比较靠前的位置,将在一定程度上决定网页的访问量。一些网站并不是通过提高网页质量来提高其在搜索引擎中的排名,而是根据搜索引擎自身的特点,采用欺骗手段来提高排名,这就是网页作弊。网页作弊是搜索引擎面临的重大挑战之一。本文将结合常见的网页作弊的方法,阐述当前已经存在的比较有效的反作弊技术。  相似文献   

14.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

15.
信息检索中基于链接的网页排序算法   总被引:5,自引:0,他引:5  
介绍超链接环境下基于链接的网页排序算法,比较和分析了PageRank算法和HITS算法,指出了PageRank算法更适合于搜索引擎的服务器端,而HITS算法更适合于搜索引擎的客户端,还构造并初步实现了在信息检索中,应用超链接环境下网页排序算法的综合模型。  相似文献   

16.
Almost all current automatic service composition (ASC) algorithms consider only single nonfunctional requirements, namely quality of service (QoS), which cannot satisfy the real application. This paper proposes MAT (multi-QoS aware top-K ASC) algorithm to realize the high-efficiency exploring and rank- ing of composition scheme by synthesizing more nonfunctional goals. MAT algorithm explores composition schemes by the sky- line technique based on tape model and ranks these schemes by a modified binary tree. Using Web service challenge (WSC) 2009 dataset, we verify the performance of MAT algorithm and the experimental result is even close to the current fastest ASC algo- rithm considering only single QoS.  相似文献   

17.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

18.
提出了一种适用于多镜像站点环境下的分布式Web使用聚类局部挖掘算法LUC和全局挖掘算法GUC,较好地解决了Web访问信息的异地存储、分布式算法通讯量等因素给模式分析过程带来的困难. 将给出的算法用Java语言加以实现,并对算法性能进行了研究. 结果证明,该算法是有效的,可以用来高效、准确地在多镜像站点环境下发现Web用户群体模式.  相似文献   

19.
Biogeography-based optimization(BBO),a natureinspired optimization algorithm(NIOA),has exhibited a huge potential in optimization.In BBO,the good solutions have a large probability to share information with poor solutions,while poor solutions have a large probability to accept the information from others.In original BBO,calculating for migration rates is based on solutions' ranking.From the ranking,it can be known that which solution is better and which one is worse.Based on the ranking,the migration rates are calculated to help BBO select good features and poor features.The differences among results can not be reflected,which will result in an improper migration rate calculating.Two new ways are proposed to calculate migration rates,which is helpful for BBO to obtain a suitable assignment of migration rates and furthermore affect algorithms ' performance.The ranking of solutions is no longer integers,but decimals.By employing the strategies,the ranking can not only reflect the orders of solutions,but also can reflect more details about solutions' distances.A set of benchmarks,which include 14 functions,is employed to compare the proposed approaches with other algorithms.The results demonstrate that the proposed approaches are feasible and effective to enhance BBO's performance.  相似文献   

20.
介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号