首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
探讨了针对概率XML文档集中与内容相关的关键字检索结果的排序问题,针对概率XML文档的特征提出了一种新的排序模式.与仅取决于检索结果概率的检索排序算法不同,本文提出的排序算法充分考虑了节点对文档的区分程度、节点描述文档的程度,以及XML文档本身的结构特性,设计了满足以上特征的检索结果排序模型,并针对排序模型提出了新的倒排索引结构.新的排序算法可以快速完成关键字检索,并将最相关的信息提供给用户.模拟数据集实验验证了该方法的有效性.  相似文献   

2.
信息检索中,个性化排序在传统的基于内容匹配的排序算法基础上,结合用户兴趣特征,返回更符合用户需求的检索结果.由于用户数据存在稀疏性和兴趣爱好不均衡等问题,用户兴趣偏好模型构建通常不是很精确,检索效果也不佳.本文在前人研究的基础上,提出了一种基于用户类别偏好的个性化排序方法.该方法首先借助词向量技术计算查询词和文档标签集之间的语义相似程度,其次,考虑到用户对不同兴趣的偏好程度不一,通过构建用户兴趣偏好模型,计算出用户对不同兴趣类别的偏好程度,对待查询文档进行个性化处理,以达到个性化排序的目的.在真实数据集上的实验表明,与传统方法相比,本文提出的方法可以有效地改善用户的个性化检索效果.  相似文献   

3.
信息检索的核心问题就是在文档集中为用户检索出最相关的子文档集,并依靠排序算法对检索结果按照相关性进行排序,因此排序算法的优劣直接影响检索的效率.RLR算法改进了正则经验风险模型,大大减少了计算复杂度.通过设定一定范围的允许误差值,采用对称ε-insen-sitive对数亏损函数作为亏损函数,给出对称ε-insensitive对数亏损函数满足的一些特殊性质,进而改进RLR算法.实验表明新算法对文本排序是有效的.  相似文献   

4.
为了加强面向领域的搜索技术查询有效性与准确性,在证券领域本体的基础上对检索表达式进行扩展,使检索内容更加相关.对于初始检索集,根据本体进行面向语义排序,提高了检索结果集相关度.对面向证券领域的语义信息检索系统框架数据流与算法效率进行了分析,并对语义排序算法功能进行增强,得到自适应热点算法扩展,使系统可以在特定时间段内根据用户点击率反映阶段性关注热点.  相似文献   

5.
为了解决密文检索实际应用过程中,存在的安全性问题、检索效率低下及检索结果存在冗余,对用户的需求针对性不强等问题,通过对现有的密文检索进行分析与研究.提出改进的密文索引构建策略,提出基于历史的密文检索结果排序方案,设计并实现密文检索原型系统,在保证密文检索安全和检索效率的同时,使检索的结果更加符合用户的需求.  相似文献   

6.
基于本体的语义检索是建立在语义网基础上的检索技术,它能提高检索的查全率和查准率.本文结合本体对构件库的检索进行研究,给出了基于本体的构件库检索框架以及检索流程,讨论了需求、规则的相关概念及其性质以及需求/规则的映射方法.在规则推理的讨论中,引入了匹配度和优先级算子的概念,并对匹配度进行了扩展,使检索结果能够进行全局排序.  相似文献   

7.
在对海量的多媒体数据进行检索时,传统的基于数值/字符的信息检索技术并不能满足要求.因此,基于内容的多媒体检索技术的研究应运而生,其检索的依据主要是多媒体的特征向量值,因此多媒体信息特别是图像的特征向量的组织直接影响到数据检索的效率.对基于内容的多媒体检索技术进行了研究,同时借鉴基于关键字的检索技术,引进了二叉排序树来组织图像的特征向量,利用二叉排序树算法进行特征向量值的检索,提高了图像检索的效率.  相似文献   

8.
在研究已有基于流形排序图像检索算法存在问题的基础上,提出一种基于重选择流形排序的图像检索算法,此算法可以在节约时间的同时,进一步提高检索结果的精度,并在实际图像数据库中的实验结果验证了此算法的有效性.  相似文献   

9.
将传统的"词袋"思想进行扩展,把文档看成由句子组成的"句袋",通过依存句法分析得到"句袋"与查询中词间的依存关系。利用两者依存关系的匹配程度,计算冗长查询和初次检索返回文档之间的相似度,对初始检索结果进行重排序。通过在TREC标准数据集上的实验,证明该方法能够较有效地解决查询的冗长导致偏离查询主题和低召回率情况下相关文档排序靠后的问题。特别是对于低召回率的情况,检索结果的MAP值和P@N都有显著提高。  相似文献   

10.
将传统的“词袋”思想进行扩展, 把文档看成由句子组成的“句袋”, 通过依存句法分析得到“句袋”与查询中词间的依存关系。利用两者依存关系的匹配程度, 计算冗长查询和初次检索返回文档之间的相似度, 对初始检索结果进行重排序。通过在TREC标准数据集上的实验, 证明该方法能够较有效地解决查询的冗长导致偏离查询主题和低召回率情况下相关文档排序靠后的问题。特别是对于低召回率的情况, 检索结果的MAP值和P@N都有显著提高。  相似文献   

11.
以Gnutella为代表的P2P系统通常会呈现复杂的网络结构,为此,文中提出了一种基于节点簇的随机漫步搜索算法.该算法利用节点簇来存储系统中文件的索引,通过将搜索过程限制于节点簇内部来提高搜索性能.基于数学模型的理论分析,文中给出了搜索性能上下界的数学描述.实验结果表明:搜索性能与簇的阈值c密切相关;c的建议值为系统中节点最大度值的一半,与普通随机漫步相比,此时稀有文件的搜索效率至少可以提高250%,文件索引的传输和存储代价可以减少一个数量级;该算法具有索引存储代价非常低、搜索效率高、易于实现和部署的优点.  相似文献   

12.
以Gnutella为代表的非结构化P2P系统通常会呈现复杂网络结构,针对其度分布服从幂律分布的特点,提出一种基于节点簇的搜索策略。该策略利用节点簇来存储系统中文件的索引,通过将搜索过程限制于节点簇内部来提高搜索性能。然后,基于数学模型的理论分析给出了搜索性能上下界的数学描述。实验结果表明,搜索性能与簇的阈值c密切相关;c的取值范围灵活性很大,此时稀有文件的搜索效率至少可以提高一倍以上,文件索引的传输和存储代价可以减少一个数量级。该策略不需要学习全局拓扑知识,具有稳定并且易于实现和部署的优点。  相似文献   

13.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

14.
针对用户在搜索结果列表中寻找所需信息困难的问题,在分析了Web搜索结果的特点的基础上,提出了一种结合K-Means的层次化方法对搜索结果进行聚类,并通过向用户提供查询结果的类别标签分类显示结果,从而大大提高可浏览性.同时,在该方法的基础上设计并实现了一个搜索结果聚类原型系统,实验结果表明新方法是可行的.  相似文献   

15.
电力隧道环境机器人巡检目标坐标定位过程中,利用传统搜索算法会产生信息损失,从而导致搜索定位 结果存在精度不够理想问题。为此,提出了一种共轭搜索算法。该算法通过搭建机器人巡检模型,得到反映机 器人位姿的坐标系,然后通过共轭算子规划设置机器人搜索路径。机器人沿着设置的搜索路径采集实时巡检 图像,并根据特征值识别图像中的目标节点。解算机器人在巡检过程中的位姿,并结合手眼标定和空间坐标的 测量结果,实现机器人巡检目标的搜索和坐标定位。对比实验结果表明,所提出的共轭搜索算法对目标位置的 定位环境风险评价( ERA: Environmental Risk Assessment) 指标更趋近于0,与传统搜索算法相比具有更好的定 位精度。  相似文献   

16.
可搜索加密保证了加密云数据的可检索性,然而提供云服务的一方并不是完全可信的,利益驱使其不诚实地执行搜索或恶意隐瞒数据泄露,因此对加密搜索结果进行验证是非常必要的。结合已有的研究成果,得到了一个可验证公钥可搜索加密协议模型。从此模型出发,利用布隆过滤器建立搜索结构,利用基于生物信息的加密技术建立访问控制,利用双线性签名技术等建立认证,实现了基于生物特征的公钥可搜索加密协议的可验证性,最后对其正确性和安全性进行了证明。验证结果表明该方案在一定程度上保证了加密搜索的安全性和搜索结果的可验证性。  相似文献   

17.
为研究用户推荐对网络搜索行为的影响,将用户推荐加入到搜索引擎结果页面中,通过眼动跟踪技术观察被试在完成网络搜索任务时行为的变化.实验结果显示,加入用户推荐对被试的搜索效率、注意力分布和点击分布没有显著影响.但反馈问卷显示,多数被试认为用户推荐有助于搜索,并且会在搜索中参考该信息.分析发现,两种结果矛盾的原因在于被试在搜索过程中常常会忽略用户推荐,产生无意视盲(inattentional blindness)现象.   相似文献   

18.
为解决传统搜索引擎个性化的局限性问题,在研究用户感兴趣搜索引擎现状基础上,通过多Agent较全面记录、分析用户搜索的行为,提出了一种新的综合用户搜索行为,构建用户感兴趣搜索引擎研究框架--基于多Agent搜索行为分析的用户兴趣模型。研究结果表明,依据用户搜索行为构建用户兴趣模型,使搜索引擎返回结果更贴近用户需求。满足用户个性化服务,提高了信息搜索的查全率和查准率。  相似文献   

19.
Gnutella2的搜索算法在超级节点间转发消息采用泛洪机制,在大规模文件共享中产生较多冗余消息,降低了搜索效率.为提高搜索效率,提出一种基于节点热度的改进搜索算法.该算法根据P2P网络中的幂律特性,提出节点热度概念,根据节点热度选择转发超级节点,设计了基于节点热度的搜索算法;在节点热度的计算中,引入惩罚因子减少无效搜索;在搜索消息转发时,通过最热轮空策略来均衡高热度节点的负载.对实验结果的分析表明,该算法在保证搜索命中率的前提下,能有效减少平均搜索时间和平均跳数,提高了搜索性能.  相似文献   

20.
遗传算法具有快速随机的全局搜索能力,但当求解到一定范围时往往做大量无为的冗余迭代,求精确解效率低.模式搜索具有很强的细搜索能力,但是其搜索结果的好坏在很大程度上依赖于初始点的选择.本文提出了一种混合遗传-模式搜索算法,该方法是将种群分成两个子群,分别进行遗传算法与模式搜索算法,在每一步中两个子群的最佳结果收集起来,用于更新相互的最优个体.仿真结果表明遗传算法与模式搜索的混合优化方法取得了较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号