首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 468 毫秒
1.
传统数据库只管理确定性信息.但在许多应用中涉及大量不确定数据。本文把概率数据引入XML文档中.提出概率XML文档树、概率XML模式树、概率XML文档树符合概率XML模式树的定义;给出了概率XML Twig查询树和概率XML Twig查询匹配的定义,最后提出了计算概率XML Twig查询结果概率的定理。  相似文献   

2.
分析了影响FP查询速度的原因,并在此基础上提出了一种新的基于二级串联布隆过滤的冗余数据块发现算法.实验结果表明:该算法在FP查询性能及数据存储速度方面优于已有算法.  相似文献   

3.
一种新的基于编码的XML结构连接算法   总被引:1,自引:0,他引:1  
XML文档的结构查询处理中通常包含判断XML结点间父子关系或祖先-后代关系的结构连接操作。目前,已经提出了一系列有效的结构连接算法,这些结构连接算法大都基于归并的思想,充分利用XML数据结构的特点来减少连接的扫描代价。本文提出了一种新的XML文档树编码方案,并在该编码方案的基础上设计了一种新的结构连接算法StruContact。该算法集成了Holistic Twig的两个结构连接算法(PathStack和TwigStack算法)的功能,实验表明,可有效提高结构连接操作的效率。  相似文献   

4.
聚合查询(GNN)在网络环境中是一个相对比较新的操作.与传统的只有一个查询结点的任意性,使得GNN查询比只有一个查询点的kNN查询复杂得多.文章提出了一种基于2个查询点的差值聚合查询,基于单查询点的YPK-CNN,利用双曲线性质把查询空间分成几大部分,在此基础上计算出双曲线的渐近线以简化删减条件,直接删减掉不符合条件的搜索空间.实验结果显示,针对这种特定的差值聚合查询,我们所提出的基于双曲线渐近线过滤策略的查询算法要比基本查询算法在查询响应时间和访问结点次数方面更高效.  相似文献   

5.
提出了一种新的高维查询空间过滤策略,通过将高维数据动态投影到低维的数据空间中,然后在投影空间中对查询空间进一步过滤,精练并快速缩小查询空间.同时提出了一种有效的投影策略基于最大间隔投影,这种投影策略能够提高投影空间的精练能力.而且,设计了一种新的高维索引结构MS-tree,并将新的过滤策略运用于MS-tree的范围查询.实验结果表明,这种查询空间精练策略能够有效的提高索引的性能,降低相似性查询的IO代价和CPU代价.  相似文献   

6.
基于不确定数据的频繁项查询算法   总被引:2,自引:0,他引:2  
频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低...  相似文献   

7.
提出了一种基于元素编号的系统XISS进行索引和存储XML数据,编号方式能迅速地确定XML数据层次结构中元素间的祖先-子孙关系;同时在XISS中采用了一种处理有规则路径表达式的算法:EE-Join(元素-元素加入算法),EE-Join算法对于查询那些长路径或者长度不确定的路径特别有效.  相似文献   

8.
提出一种动态交换的策略,对一个元素计数后,根据计数值的大小将元素移动到序列的合适位置,使得算法在每运算一个元素后,元素间的排列都是有序的,计数值大的元素位于序列的前端,从而有效地减少了查询时间.分析了算法的时间及空间复杂度,并通过实验验证了算法的实时性与高效性.  相似文献   

9.
改进规则的可放缩矢量图形地图的查询模型   总被引:1,自引:1,他引:0  
分析了基于SVG(可放缩矢量图形)格式时态GIS(地理信息系统)领域,尤其是地理元素查询方面的研究现状,针对现有的XML(可扩展标记语言)查询方法进行了分析和对比.在基于SVG语法规则改进研究的基础上,并结合LISAⅡ(layered intersection scan algorithmⅡ,分层交叉扫描算法Ⅱ)查询技术,提出了一种适合改进规则的SVG格式的GIS数据地理元素查询模型及其算法,通过定义关键字查询语法规则表达式,定义关键字查询的""和"or"操作规则,实现了组合查询;通过定义实体元素节点,减少了节点数,提高了查询效率.该模型实现了SVG格式地图的地理元素查询,包括对整幅地图的各种组合查询和分图层的各种组合查询,解决了基于SVG格式地图元素查询的技术瓶颈.大量的数据验证表明,该查询模型是有效的.  相似文献   

10.
根据GML数据查询的需要,在分析XML文档编码和空间索引技术的基础上,提出一种基于扩展的元素区间编码的GML索引方法.首先通过扩展的区间编码方法对GML文档中的元素、属性、文本、几何体等要素进行编码;其次依据元素编码算法并将非空间节点、空间节点、元素节点从GML文档树中分离,产生元素编码序列;在此基础上根据节点类型的不同对属性和文本节点建立B+树索引以实现值查询,对几何体节点建立R树索引以实现空间数据的分析操作,并在查询处理时通过查询优化算法避免不必要的节点的遍历,进一步提高查询效率.实验结果表明,基于元素区间编码的GML数据索引方法是可行的、高效的.  相似文献   

11.
Holistic twig query processing techniques based on region encoding have been developed to minimize the intermediate results, namely, those root-to-leaf path matches that are not in the final twig results. These algorithms have to scan all the streams of tags in query patterns. However, useless path matches cannot be completely avoided. TJFast which is based on the labeling scheme of Extended Dewey has been proposed to avoid useless intermediate results, and it only needs to access the labels of the leaf query nodes. However, it don't concern about the characteristics of elements with the same parent, and it has to merge join all the intermediate results which are evaluated during the first phrase. We propose a new labeling scheme to compress the XML elements which have the same characteristic. Based on the compressed path-labeled streams, a new novel holistic twig query algorithm named CPJoin is designed. Finally, implementation results are provided to show that CPJoin has good performance on both real and synthetic data.  相似文献   

12.
XML has been used extensively in many applications as a de facto standard for information representation and exchange over internet. Huge volumes of data are organized or exported in tree-structured form and the desired information can be got by traversing the whole tree structure using a twig pattern query. A new definition, Extended Solution Extension, is proposed in this paper to check the usefulness of an element from both forward and backward directions. Then a novel Extended Solution Extension based algorithm, TwigStack^+, is also proposed to reduce the query processing cost, simply because it can check whether other elements can be processed together with the current one. Compared with existing methods, query evaluation cost can be largely reduced. The experimental results on various datasets indicate that the proposed algorithm performs significantly better than the existing ones.  相似文献   

13.
针对XML数据流可能具有复杂的递归层次结构,提出一种XML数据流小枝匹配算法TwigPM.通过获取查询节点的结构关系,进行有效的剪枝操作,减少了处理时间和数据所占用的内存空间.实验结果表明,算法具有高效性.  相似文献   

14.
A new way of indexing and processing twig patterns in an XML documents is proposed in this paper. Every path in XML document can be transformed into a sequence of labels by Structure-Encoded that constructs a one-to-one correspondence between XML tree and sequence. Base on identifying characteristics of nodes in XML tree, the elements are classified and clustered. During query proceeding, the twig pattern is also transformed into its Structure-Encoded. By performing subsequence matching on the set of sequences in XML documents, all the occurrences of path in the XML documents are refined. Using the index, the numbers of elements retrieved are minimized. The search results with pertinent format provide more structure information without any false dismissals or false alarms. The index also supports keyword search Experiment results indicate the index has significantly efficiency with high precision.  相似文献   

15.
对遗传算法和ART1分类器在信息过滤中的应用进行了研究与探讨,提出了一种全新算法。利用用户的积极和负面反馈过滤信息,使用ART1网络分类器生成用户的动态配置,并通过遗传算法产生理想的查询。试验结果表明:根据该算法提取的搜索结果,提高了信息过滤的准确率。  相似文献   

16.
根据图层定义,提出了针对可缩放矢量图形(SVG)格式地图的模糊查询模型.通过构建模糊查询词库来储存模糊查询相关词和模糊查询匹配模式.在此基础上,提出了分词子算法,将查询语句分解为词串.据此给出了语义分析子算法,将分词子算法产生的词串转化成模糊查询匹配模式,并与SVG格式地图相关层(一层或多层)中的元素关联以实现模糊查询.最后实验验证证明了该模型的有效性.  相似文献   

17.
基于加权概念网络的用户兴趣建模   总被引:5,自引:0,他引:5  
提出了一种基于加权概念网络(WCN)的用户兴趣建模方法,该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立WCN的用户模型,从而捕捉和表述用户兴趣偏好.基于WCN用户兴趣模型,提出了检索提问个性化理解以及文档个性化重评价的实现方法.为了检验提出方法的建模性能,设计了信息过滤仿真试验.测试结果表明,WCN有较好的用户建模性能.  相似文献   

18.
提出一种适用于传感器网络的抽样带权阀值过滤近似Top-k聚集查询算法.该近似算法会将无线传感器网络划成几个两两不相交的簇进行处理,在汇聚节点进行预处理以及在各个簇内进行抽样过滤处理,在抽样过程中给可靠而重要的节点赋上相应更大的权值,同时根据节点采集的信息具有时间相关特性,在簇内进行抽样阀值过滤处理,每个簇头节点都会接收到该簇内的Top-k候选子集,然后将每个簇的子集发送给Sink节点,该Sink节点将接收到能代表整网Top-k样本候选集.仿真实验结果显示该算法只需发送少量的数据,更小的抽样样本,并能满足任意精度要求.  相似文献   

19.
协同过滤算法为推荐系统提供了一种方法,但传统的协同过滤方法推荐精度低.提出一种考虑用户评分相似性的协同过滤算法,通过在皮尔逊相关系数中加入项目数量相似度和用户评分相似度两个因素来计算用户间的相似度,以产生更合理的邻居用户,提高推荐精度,完成对用户的推荐,同时邻居用户的选取采用动态阈值设定方法.实验结果表明,所提出的算法相比传统方法选择出的邻居更为精确,推荐质量更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号