首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
一种无结构 P2P 系统中基于层次兴趣树的语义检索机制   总被引:1,自引:0,他引:1  
提出了一种无结构P2P系统中有效的语义检索方法: 基于层次兴趣树(HIT) 的语义检索。每个节点中所有的文档根据分类 目录被分类成层次兴趣树, 并发送至该节点所属的超级节点。同时, 每个类中前 n个关键词的倒排文档索引, 也会依据它们的χ2统计值被发送至超级节点。当节点发送一个查询并给出类别语义相似性阈值Simth时, 查询消息通过一个有效的查询路由算法被转发, 结果则通过搜索HIT返回。不同的节点可以给出各自不同的Si mth, 其灵活性可以为每个节点提供更好的个性化服务。实验表 明在无结构的P2P系统中, 基于HIT的语义检索方法比以前的方法具有更好的准确性和有效性。  相似文献   

2.
在多关系连接查询中,普通半连接查询方法没有优化子查询的半连接顺序,导致查询代价较高,为此,本文提出了一种改进的半连接查询优化算法.首先,将多关系连接组织成较小代价的类树形结构,然后利用半连接操作对处于根节点处的关系进行最大化缩减,并以此为基础利用PERF位向量对其他节点进行缩减,最后回收缩减关系进行连接操作.模拟实验表明改进的半连接查询优化算法能够有效地缩减查询关系,降低查询代价.  相似文献   

3.
基于相似性的数据挖掘模型,主要是用于发现分布式资源之间的相似性,利用相似性,融合分布式数据库,减小数据挖掘的规模.本文主要介绍以关联规则中最大频繁项集为基础的一个相似性的度量方法,并根据对得到的相似性值的判断,来决定数据挖掘的数据源的引用规模.  相似文献   

4.
随着Web服务量日益剧增,如何推荐给用户符合其期望的服务尤为重要.协同过滤是服务推荐系统中应用较广泛的算法,但协同过滤往往存在数据稀疏问题.针对该问题,文中提出了一种基于用户相似性传递的协同过滤推荐算法,通过改进的皮尔逊相关系数计算出用户间的相似性,利用用户相似性构建相似性网络,并根据用户等级、最短路径和六度分隔理论进行用户间的相似性传递,以此增加目标用户的相似用户的数量,缓解了数据稀疏问题,然后根据传递填充过的用户相似网络进行服务的评分预测.最后以美团网的真实数据进行了实验,实验结果表明文中提出方法一定程度上可以提高推荐结果的准确性.  相似文献   

5.
基于VLCA的关键字查询匹配算法   总被引:1,自引:0,他引:1  
与标准的方法--XQuery查询语言不同,xML文档的杂模式和掌握复杂查询描述语言.对关键字查询中两个主要问题进行定义,提出一种基于VLCA的启发式结构分析算法;并对结果节点使用关键字分类算法进行推断.该算法能综合分析xML数据的值信患和结构信息,适用于子树返回和路径返回的精确查询要求.  相似文献   

6.
基于关键词的RDF数据查询方法   总被引:1,自引:0,他引:1  
在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.  相似文献   

7.
为准确地推断XML关键字查询中用户的查询目标,提出一种基于结构耦合的目标节点推断方法.在获取目标节点时,考虑了某条路径下XML节点出现的频率,同时也考虑了该路径的长度对目标节点类型的影响.通过分析,引入XML文档树的结构耦合度的计算,进行目标节点的推断.结果表明,该方法可以得到更加准确的目标节点,提高查询查准率.  相似文献   

8.
如何准确表达用户意图,判断网页与用户需求的相关性是信息检索技术研究的重要方向。本文提出了一种基于网页内容分割的语义信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。实验表明,本文提出的方法可以显著地提高搜索引擎的查询效果。  相似文献   

9.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

10.
针对目前的查询优化技术并没有考虑网格环境中数据源的动态特征,导致数据访问质量很差的问题,文中提出了网格环境中具有服务质量(QoS)支持的数据访问方法.它能在查询优化的过程中考虑数据源的动态特征以及用户的QoS要求,根据用户的QoS要求选择不同的查询执行计划;文中还提出了基于管道并行方式的分层管道树来对多连接表达式进行优化,它不仅可以提高并行度而且可以尽快返回部分结果给用户.实验结果表明,文中提出的方法是有效的,可以为不同类型的用户提供不同等级的数据访问服务.  相似文献   

11.
一种启发式异构分布式数据库的查询优化方法   总被引:8,自引:2,他引:6  
目的提高异构分布式数据库的直询处理速度.方法提出了一个求异构分布式数据库查询处理中,使网上数据传输量达到最小的连接与半连接执行序列的启发式算法.该算法通过一个系列启发式规则,在搜索空间中,选择最有希望的节点作为下一个被扩展的节点,以减少搜索的节点数.结果提出了有用半连接的概念,虽然有的半连接就其本身讲是无益的,但是与一系列连接结合起来使用却是有益的,结论该方法能提高分布式数据库的查询处理速度,尤其在广域网上效果更为明显.  相似文献   

12.
提出了基于查询过程的动态计算数据源和查询关键词相似度的算法.当用户查询时,从数据源中选择子集进行查询,然后计算结果网页与查询关键词的相似度,按加权均值法调整该数据源的相似度,随着系统的运行,数据源与关键词的相似度不断被动态调整以反映数据源的实际情况,从而为数据源选择做出判断依据.  相似文献   

13.
基于B 树,并借鉴XB树的特点设计一种XM L文档的索引方法.索引关键字分为元素关键值和XM L编码的范围.利用元素编码的范围查询,不必在整XM L文档中搜索,提高了查询效率.对于复杂分支查询,提出了拆分成简单查询路径的规则.在结构化连接问题上,提出了不仅要进行祖孙(父子)关系的连接,还要进行兄弟关系的判断,以得到正确的匹配结果.  相似文献   

14.
随着动态图形在网络应用领域的发展与扩展,针对当前相似节点查询算法存在运行响应速度慢、查询占用的存储空间较大、容易受到外界因素干扰而导致查询精确度不佳等问题,提出基于语义分析的大规模动态图形相似节点查询算法。首先,依据语义分析的方法,对动态图形相似节点数据进行预处理,获取节点相似性函数;其次,针对当前节点在不同时刻的相似性函数,设计相应的矩阵以增强计算效率;最后,将求出的节点相似程度值按照升序顺序进行排列,将相似程度值最高的节点看作相似节点,实现相似节点的查询。实验结果表明,所提算法查询速度快,查询精确度较高。  相似文献   

15.
针对目前传统关系型数据库中的历史数据向非关系型数据库迁移的低效率问题,提出利用多叉树模型对历史数据存储模式进行重构.基于4种模式迁移规则对各表节点之间的关联关系进行分析,推导算法完成传统关系型数据库中存储模式和历史数据的自动化迁移.该算法不受源数据库存储模式的限制,具有一定的通用性.数据迁移实验表明:在查询性能上,基于多叉树的迁移算法比官方迁移工具Sqoop有较大的提高.  相似文献   

16.
全局查询效率一直是中间件异构数据库集成中的热点和难点问题,由于目前异构数据库绝大多数是关系型数据库,所以采用半连接方法优化连接操作,并在半连接图的基础上提出了多个站点的半连接执行方案优化算法,该算法根据半连接图生成有向无序树,使多个半连接操作能够并行执行,经分析能有效地提高全局查询效率.  相似文献   

17.
由于在传送过程中存在数据失真、丢失或者网络延迟等原因,时空数据的不确定性普遍存在且无法避免,因此需要研究一个折中办法,使其不影响对数据的处理.基于XML建立不确定时空数据模型表达时空数据具有更多优势,可以更好地管理不确定时空数据.传统的关系数据库对数据的表示以关系为基础,对时间的表示有大量的数据冗余,使其不能很好地表示不确定时空数据.基于XML构建不确定时空数据的表示模型,对各个节点分类,对于特殊的不确定节点,引入概率属性来表述,提高了数据表示能力.  相似文献   

18.
为减少数据查询的能量消耗,有效延长无线传感器网络的生存时间,提出了一种基于过滤器的K-NN深度优先查询(FKDF)算法.通过为每个节点设置过滤器来确定K-NN查询区间;利用查询节点的邻接表信息,在进行深度优先遍历时生成查询消息;基站分发查询消息,并等待查询节点返回查询结果,从而减少查询的平均跳数.仿真结果表明:与FILA设置过滤器方法和GPSR路由算法相比,FKDF算法节约了查询所需的平均跳数,能够适应网络拓扑结构的动态变化,当K值经常变化时不增加查询开销.  相似文献   

19.
针对现有无线传感器网络恶意节点检测方法效率较低的不足,提出一种基于增强低功耗自适应集簇分层(enhanced low energy adaptive clustering hierarchy,enhanced LEACH)路由协议信誉机制的恶意节点检测(malicious node detection based on enhanced LEACH with reputation,MNDELR)模型.在无线传感器网络中使用增强LEACH路由协议选取簇首节点,其余节点选择对应簇首形成各簇集群并确定网络数据包传递路径.节点在数据包内添加节点编号、信誉评价等信息并按传递路径将数据包发送至汇聚节点;汇聚节点解析获取数据包内节点编号并与源节点编号比较判定,形成可疑节点列表;计算节点信誉值并与阈值比较判定网络中的恶意节点.实验结果表明,与其他方法相比,MNDELR模型在无线传感器网络中对恶意节点的检测效果较为显著.   相似文献   

20.
Java语言是目前应用十分广泛的语言,被称为网络上的“世界语”,它也支持使用结构化查询语言(SQL)查询代码访问和操纵关系数据库.以常见的采购系统为例,分析了其数据流程,并用Java语言实现了访问关系数据库中的信息及对数据库进行操作.限于篇幅,文中给出了部分源代码,并对重点部分给予了解释,以说明Java语言通过SQL查询代码对关系数据库进行访问和操作的技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号