首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
传统搜索引擎无法满足用户对社区网络中实时信息的需求。给出一种实时搜索引擎模型,利用经过算法优化的网络爬虫,实现制导式的数据抓取,同时利用社区网络提供的开放API获得更新数据。通过XML结构化数据,使用改进的向量空间模型对信息进行过滤和分类,并采用考虑时间因素的相关度算法对搜索结果进行排序。实验证明该模型能够实现搜索结果的实时性,并且能够保证搜索项与搜索结果之间比较高的相关度,为用户提供更好的搜索体验。  相似文献   

2.
针对现有的社团分析算法无法在大规模网络上应用的问题,提出一种社团抽取算法,可以高效地分析网络的社团特征.该方法无需事先获取网络的全部拓扑结构,采用网络搜索与社团判定相结合的思路,可有效地抽取结构未知的社交网络上的某个特定社团,从而使分析超大规模网络社团结构成为可能.在仿真数据集上进行实验,分析抽取准确率的影响因素,得出网络平均度越大抽取准确率越高.进一步实验结果表明,社团抽取算法的准确率与现有方法接近,并且执行效率明显高于现有方法,验证了该算法的可行性和有效性.  相似文献   

3.
基于超链接分析搜索引擎页面排序算法的剖析   总被引:1,自引:0,他引:1  
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。  相似文献   

4.
为了提高专业搜索引擎的查询精度,提出了一种基于PageRank算法的改进搜索结果融合算法.首先,通过对元搜索引擎技术的分析,将rtf算法和PageRank算法进行融合,提出了基于PageRank算法的改进算法.该算法可以实现基于同义词、近义词的查询,将这种改进的算法在煤地质学专业搜索引擎上进行使用,实验结果表明,采用该...  相似文献   

5.
基于位置社交网络(Location-Based Social Network,LBSN)服务使得用户能够利用位置服务发现附近的人.原始的LBSN服务为用户提供确切的相对距离,而这种做法已被证实易于遭受三角定位攻击.为防御此类攻击,当今LBSN服务普遍采用以带宽的方式来报告距离.本文利用数论,通过技巧性地摆放虚拟探针,伪装地理位置,提出了一种不受地理位置限制、高精度、易于实现的定位目标算法.作为概念验证,本文使用微信进行实验最终验证了该攻击算法在实际部署中的有效性.本文的研究旨在呼吁LBSN服务提供商改进位置隐私保护技术,唤醒公众充分认识LBSN软件所带来的潜在隐私泄露.  相似文献   

6.
相关排序技术是搜索引擎结果处理的一个核心技术,其排序算法的优劣直接影响查准率.笔者阐述了现有排序算法的优缺点,分析了不同排序算法对查准率的影响,从根集的质量、噪音链接、查询分类几方面进行了优化并考虑了综合因素,提出了一种切实可行的相关排序实现方案.  相似文献   

7.
搜索引擎是用户利用网络资源不可或缺的工具,但目前搜索引擎的查准率有待提高。对于不同的用户而言,即便是相同的查询词其期望的查询对象可能不同,那么搜索引擎此时的查准率其实就是让搜索引擎具有个性化搜索的特点。个性化搜索引擎的关键是用户兴趣的确定和文档兴趣值的确定,只有把抽象的个性化兴趣量化成数值类的模型,才可以了解用户真正的需求和量化文档与兴趣的相关程度,从而准确地对网页进行筛选并达到个性化排序的功能。  相似文献   

8.
GitHub社交平台是代码托管领域的主流平台,拥有超过7300万开发人员.评估GitHub社交网络中用户的影响力对开源成果的学习和应用有重要意义.针对PageRank算法及其改进方法在评估用户影响力时对用户交互行为与用户自身因素分析不全面的局限性,提出了一种引入用户行为权值分配策略的影响力计算方法CUIE(Comprehensive User Influence Evaluation)算法,将用户行为对其他用户影响力的贡献比例作为权值计算用户的CUIE值.基于真实数据的实验结果表明:将用户交互行为作为评价用户影响力分析的因素之一,能使模型获得更好的结果,与传统算法进行对比,在Top-500及以上的情况下,CUIE算法均取得最优的准确率和召回率.此方法能有效发现被传统方法忽略的部分核心用户,可作为传统方法的补充,在舆情分析与引导中也具有一定实用价值.  相似文献   

9.
提出了一种基于关联规则的社交网络好友推荐算法,在进行好友推荐时,考虑现实社交活动中"志趣相投"的好友常常会关注相同的人和事,网络社交中的好友也常常会关注相同的"人"和"事",将"关注"看成一条交易记录,把关注的用户看成交易项,所有交易项的集合看成交易数据库,生成二阶候选项集,并按支持数降序排序,推荐前N个用户作为好友。以新浪微博993 950条用户关注数据及552 600条微博关注数据作为实验的对象,实验结果表明,算法具有良好的性能,可实现较高的召回率与准确率。  相似文献   

10.
在移动社交网络中,人们通过携带无线设备在近距离范围内彼此传递信息,从而达到信息的传播。由于移动社交网络中一般不存在端到端的连接,使得数据转发算法成为一个重要问题。文章从社区和节点的社会属性角度,利用社区和节点的影响力,提出了一种基于影响力的数据转发算法(data forwarding algorithm based on impact,DFAI)。在该算法中,携带数据包的节点只有在遇到影响力达到一定要求的节点时,才拷贝数据包给相遇节点。仿真试验结果显示,与经典的Epidemic和Label算法相比,DFAI可以明显降低网络开销,同时接近Epidemic算法达到的最大传递率。  相似文献   

11.
根据校园网的网络结构和资源分布特点,针对经典PageRank算法采用的平分页面自身PageRank值的策略,提出了基于关键词集的网页关联权重分配PageRank值的改进算法.权值由页面问的关联程度和用户的搜索关键词确定,从而提高了校园网搜索引擎的搜索匹配程度和结果页面的排序质量.  相似文献   

12.
元搜索引擎中基于用户兴趣的个性化调度模型   总被引:7,自引:0,他引:7  
元搜索引擎的调度策略是研究元搜索引擎如何为用户选择数量合适并贴近用户查询需求的成员引擎,以较小的资源耗费,帮助用户获得较高的查询质量.该文提出了基于兴趣分类采样的成员引擎特征表示的方法和基于用户兴趣的成员引擎个性化调度算法.调度算法根据用户的兴趣计算出各成员引擎与用户查询的相关度,为用户选择最具有潜在有用的多个成员引擎来为用户提供查询服务.实验表明,该模型提高了用户的检索效率和质量.  相似文献   

13.
分析了Web检索引擎的工作原理,介绍了一个校园网Web搜索引擎原理,并给出实现中的关键技术。文中所介绍的校园网Web搜索引擎框架具有单项和多项组合全文检索的特性,可实现检索空间的限定。该原型系统已应用于校园网搜索引擎的设计中,并取得了较好的效果。  相似文献   

14.
摘 要 Nutch的排序机制使得一些传统的高质量的页面经常出现Web检索结果的前面,而新加入的高质量的Web页面很难被用户找到。针对传统基于链接算法中对新内容的迟钝性,本文提出了对网页的补偿算法,对Web上在一段时间内好的资源信息使其排名结果上升,而对于不好的资源使其下降,以此来加速优质内容的传播和网络内容的合理化。并最终把改进后的算法应用在基于Nutch的搜索引擎中,通过实验来验证和测试。  相似文献   

15.
单类协同过滤算法的研究是当前协同过滤算法研究的重要课题,其面临的主要问题是:仅仅正例数据能够被观察到,类高度不平衡,大量的数据点丢失.把社会化正则项引入到传统的单类协同过滤算法,提出一种新的基于社交网络的单类协同过滤算法来解决这些问题.在真实的包含社交网络的数据集上实验验证,该算法在各个评价指标下性能均优于几个经典的单类协同过滤算法.  相似文献   

16.
随着Internet用户对Web信息资源需求的增加,搜索引擎技术得到迅猛的发展.针对目前中文搜索引擎大多采用基于关键词精确匹配(Accurately matched)的低智能性问题,提出一种基于非确定图灵机NTM(Nondeterministic Turing Machine)智能中文搜索引擎系统,简要介绍了非确定图灵机的基本知识,详细叙述了该搜索引擎的系统架构,系统实现的基本原理和算法.实验数据结果表明,基于非确定图灵机智能中文搜索系统在查询结果的准确性和智能性明显高于现有的搜索系统.  相似文献   

17.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

18.
为满足用户在信息搜索中快速且准确地获取有价值信息的需求,在元搜索引擎基础上提出了一种基于AHP(Analytic Hierarchy process)方法的成员搜索引擎调度策略。该策略从成员搜索引擎对查询内容的相关度、平均响应时间和负载量3个指标来评价成员搜索引擎的性能,并根据指标权重的不同采用AHP层次分析法选择性能最佳的若干成员引擎进行调度。实验结果表明,该策略在提高查准率、缩短查询时间方面比传统的成员搜索引擎调度策略有较大改进。  相似文献   

19.
基于XML的站内搜索引擎的实现研究   总被引:4,自引:0,他引:4  
分析了传统基于HTML的站内搜索引擎的不足和目前XML技术的特点,提出了一种利用XML文档保存查询信息、通过DOM解析文档、采用Xpath实现检索的站内搜索引擎的实现模式,并具体阐述了这种基于XML的站内搜索引擎的技术实现方式。  相似文献   

20.
系统采用分层的状态同步方式,模拟了以往较难实现的无人驾驶多车辆同步实时交互场景. 在终端内部,车辆与场景通过交换位置数据和速度数据的方式实现同步;在网络上,各终端都通过与服务器交换数据同步到场景中来,实现跨终端同步仿真,并可弹性扩展至大规模车辆仿真. 通过同步多个仿真环境中的交通参与者行为、车辆运动学观测以及时钟信号,使需要多车配合才能实现的场景成为可能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号