首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对现有方法计算SLCA语义时存在冗余计算问题,提出了一种基于列存储的倒排索引,并结合哈希查找,以自顶向下的方式查询处理的算法TDCOL-HS,来避免现有算法"公共祖先重复处理"的问题。算法以最短倒排表作为处理对象,将检测给定结点是否包含其他关键字的操作转化为哈希查找操作,其时间复杂度为×1,最后通过比较各种指标,从不同角度对算法的性能进行了验证.  相似文献   

2.
一种改进的XML关键字查询算法   总被引:1,自引:0,他引:1  
为了使XML关键字查询中的查询结果更有意义,首先研究针对XML的各种经典关键字查询算法,然后根据XML文档的结构特征,定义几种结构类型,在此基础上,提出了一种改进的SLCA算法.该算法不仅解决了在XKSearch中存在的查询结果返回无意义信息的问题,而且与XSEEK中的返回有意义信息的算法相比,有效提高了查询效率.试验结果表明,该算法在查询质量和查询效率上都有较大提高.  相似文献   

3.
针对XML(可扩展标记语言)文档提出的信息单元和信息特征的概念,利用信息单元作为候选查询结果,以信息特征表征标签信息,结合XML文档的结构语义,在TF*IDF模型的基础上,设计了查询结果的相关度排序策略.该策略同时涉及了查询结果的结构信息和内容信息,计算了信息特征的重要性,且能利用信息特征的重要性衡量不同信息特征下关键...  相似文献   

4.
利用XML文档中各路径之间相似的特点,只扫描一次XML文档,把重复的XML标记所生成的事件组合成一个聚合事件,并在基于共享前缀的NFA算法YFilter基础上,提出一种改进算法PolYFilter,实现了聚合事件的谓词计算.实验表明,与YFilter相比,PolYFilter算法减少了大量相同的有限自动机状态转移的中间状态,避免了状态集的重复计算.特别是当XML文档比较大,且重复标记比较多的时候,PolYFilter有较好的过滤性能.  相似文献   

5.
周理  刘琰 《科技资讯》2007,(35):88-89
XML数据查询的标准方法是采用XQuery查询语言,该方式的缺陷是需要用户掌握复杂的结构化查询语言,能够定义精致的查询模式描述.本文提出一种启发式的结构分析方法,通过该方法推断XML语义,实现基于VLCA的关键字查询引擎XRes,使用户能够方便地访问XML文档数据,快速获得满足查询期望的XML片段.  相似文献   

6.
QSQI是演绎数据库中自顶向查询算法的一种。但由于计算过程中重复工作太多,因而降低了执行效率。本文提出了改进的方法,在一定上可减少迭代冗余。  相似文献   

7.
针对XML文档半结构化的特点及传统tf\|idf方法仅考虑关键字在文档中出现的频率, 而未考虑XML文档中节点的语义信息问题, 利用向量空间模型, 设计一种基于XML关键字查询结果的相关度排序策略. 相关度计算充分考虑XML文档中各节点对文档的区分程度、 节点描述文档的明确程度及节点描述文档的直接程度, 以提高节点权重度量的准确性, 从而将最相关的信息提供给用户, 经DBLP数据集实验验证了该方法的有效性.  相似文献   

8.
探讨了针对概率XML文档集中与内容相关的关键字检索结果的排序问题,针对概率XML文档的特征提出了一种新的排序模式.与仅取决于检索结果概率的检索排序算法不同,本文提出的排序算法充分考虑了节点对文档的区分程度、节点描述文档的程度,以及XML文档本身的结构特性,设计了满足以上特征的检索结果排序模型,并针对排序模型提出了新的倒排索引结构.新的排序算法可以快速完成关键字检索,并将最相关的信息提供给用户.模拟数据集实验验证了该方法的有效性.  相似文献   

9.
基于VLCA的关键字查询匹配算法   总被引:1,自引:0,他引:1  
与标准的方法--XQuery查询语言不同,xML文档的杂模式和掌握复杂查询描述语言.对关键字查询中两个主要问题进行定义,提出一种基于VLCA的启发式结构分析算法;并对结果节点使用关键字分类算法进行推断.该算法能综合分析xML数据的值信患和结构信息,适用于子树返回和路径返回的精确查询要求.  相似文献   

10.
针对密集型数据查询要消耗大量内存的缺陷,设计了一种基于流的XM L文档查询算法.该算法在对XM L流的一次单向读取过程中处理XPath,接收查询表达式,将表达式转换为树形自动机,自动机以流的方式接收并处理XM L文档,同时输出当前处理结果.在查询树状态转换过程中附加了缓存操作,用于保存XM L流中暂时无法判断的文档片段.算法测试表明其占用内存空间基本恒定,不会随被查询文档的增大而增加.  相似文献   

11.
在对种子填充算法进行分析和讨论的基础上,提出了一种改进的种子填充算法,该改进的种子填充算法无论是时间还是空间效率都优于传统算法。  相似文献   

12.
通过将类间分离度函数引入到模糊C-均值聚类算法中,结合半监督的思想,建立基于信息熵的半监督模糊C-均值聚类模型,并对该模型的求解过程进行推导,提出一种新的算法.为了验证算法的有效性,将该算法在UCI数据集上进行实验,实验结果表明,该算法比仅引入信息熵的模糊C-均值聚类方法聚类性能更好.  相似文献   

13.
传统的QoS保障的单播路由算法都假设IP网络结点的状态信息可以被准确地获知,但实际网络存在许多因素使得状态信息非精确.所设计的改进算法是通过动态确定k优路径算法(k_shortest algorithm)中的k值,从而确保最终求得的路径相对其他算法所求得路径是更优的.因此能有效地降低了丢包率,提高了端到端延迟绑定的概率,通过网络仿真器Ns的仿真分析,结果表明了该算法的有效性.  相似文献   

14.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

15.
文章根据XML加密规范,对XML加密采用自定义密码算法的实现方式进行了研究。指出XML加密采用自定义密码算法时,应用系统需对所采用的密码算法进行自定义并调整XML加密文档结构,详细设计了自定义密码算法的XML加密的实现过程和相应文档结构的调整方式,对其中的关键技术做了阐述。作为XML加密采用自定义或新定义密码算法的一般实现方式,有助于XML加密的扩展应用和广泛使用。  相似文献   

16.
由于空间网络的高动态性及资源受限等原因,其可靠性面临严峻考验,亟需一种合理的风险评估及性能恢复方案.针对空间信息网的弹性恢复策略,采用基于改进遗传算法的恢复策略确定受损元件的修复顺序,以加快弹性恢复;采用网络拓扑控制方法,弱化受损关键节点的重要程度,降低网络弹性损失.实验仿真了不同恢复资源数量下采用不同恢复策略的网络弹...  相似文献   

17.
针对k-means算法对初始值敏感、易陷入局部极小值等缺点,结合遗传算法的思想,提出了一种基于遗传算法和k-means算法的混合聚类方法,为了测试该聚类算法的性能,用k-means 算法和改进的算法进行了1组实验,并对2种算法的聚类结果进行比较,实验结果表明算法能够有效地解决聚类问题.  相似文献   

18.
针对经典的节点相似性链路预测算法只考虑网络拓扑结构或者节点属性信息的问题,使用词嵌入模型Word2vec学习得到节点文本属性信息的表示,进而改进TADW(text-associated deep walk)算法,弥补其语义信息表示能力的不足.基于改进的TADW图嵌入方法提出一种融合网络拓扑结构和节点属性信息的相似性指标,并基于此相似性指标提出链路预测算法.在三个真实数据集上的实验结果表明所提出算法可以提高预测精度,并具有更好的鲁棒性,同时使用图嵌入的方法有效解决了网络数据的稀疏性问题.  相似文献   

19.
为了解决考虑生产总成本的车间调度问题,对引入加工成本、库存管理成本和拖期惩罚成本的车间调度问题进行了研究,提出了一种改进的遗传算法求解该问题。论述了改进遗传算法的编码、初始化、选择、交叉和变异操作,通过与基本遗传算法的仿真比较,验证了该算法在收敛速度和最优解值上的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号