首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
Deep web中用户需通过查询接口才能得到其中的数据,查询接口一般形成属性间m:n复杂模式匹配。为统一相同领域的查询接口,本文提出了一个基于关联规则的匹配方法,从整体上双重匹配成组属性和同义属性。  相似文献   

2.
在SF算法的基础上,提出了一种改进的数据库模式匹配算法Similarity Flooding-Complex(SF-C),它能半自动的处理简单匹配和复杂匹配,而且应用了词法分析技术,对候选匹配进行分类处理,使对简单匹配和复杂匹配的处理同时进行,一定程度上提高了效率。  相似文献   

3.
针对常规模式匹配方法在大规模模式匹配中效率不高无法满足在线应用的问题,提出了一种高效率用户查询模式匹配方法.该方法在常规模式匹配方法中引入查询模式语义环境,使用搜索技术和聚类技术裁减模式匹配的搜索空间,在保证正确率的前提下,能显著提高匹配效率,满足用户在线响应时间要求.实验证明了这种方法的有效性.  相似文献   

4.
空间模式匹配在各类基于位置的服务中有广泛的应用,但在面向空间大数据时,现有空间模式匹配算法的效率难以满足实际要求.针对上述问题,采用并行计算框架Spark,设计基于空间模式边匹配并行的空间模式匹配算法PMSJ(Parallel Multi Star Join). PMSJ算法将空间模式匹配问题分解为可以独立、并行执行的称为边匹配的子问题,将计算量分散至集群中各个计算节点以提高计算效率.具体地,PMSJ将边匹配分为针对空间区域的最小边界矩形匹配与针对具体空间对象的边匹配两个并行步骤,并在计算边匹配前对最小边界矩形匹配的结果进行剪枝,排除无法产生完整空间模式匹配的匹配对.在四个真实数据集上的实验结果表明,在面向空间大数据时,PMSJ算法的效率优于现有算法.  相似文献   

5.
网络入侵检测依赖于字符串匹配技术.尽管各种有效的字符串匹配技术不断被使用,但字符串匹配过程的消耗仍是入侵监测系统运行的主要系统开销.为了提高入侵监测系统的运行效率和运算能力,提出并设计了新的字符串匹配算法(NMSA).算法采用新的匹配思想,应用启发函数获得优于BM移动步长的新的跳跃,同时采用有限状态模式匹配自动机可同时进行多模式匹配.将算法应用于Snort系统,并和其他算法进行比较,实验证明NMSA整体上提高了系统的效率.  相似文献   

6.
针对目前路径表达式的查询,提出了一种自顶向下基于模式匹配的查询策略.利用延迟结构连接,减少了目前比较费时的结构连接操作次数;另外在自顶向下基于模式匹配的计算过程中,为了尽可能减小中间结果集,引入一个子模式栈来保存已匹配的子模式,并利用子模式的出栈动作判断当前要处理的子模式和子模式栈的栈顶元素之间的关系(相连或者相交),从而可以删掉无用的的中间结果,一定程度上优化了空间复杂度.而且,本查询策略不依赖于特定的索引结构.通过对本查询策略进行理论分析和证明,可以看出,自顶向下基于模式匹配的查询方法是有效的。  相似文献   

7.
当前的大规模数据分析通常在MapReduce框架下执行查询。由于MapReduce框架本身的冗余性以及查询之间的重叠性,复用已有查询的结果可以大幅提高查询的执行效率。复用查询的结果需要对其进行存储和匹配管理,产生高昂的系统开销,抵消复用的部分效果。本文针对目前先进的查询结果复用系统ReStore在管理查询结果和匹配中存在的效率低下的问题,提出森林结构的Job存储管理技术和与之相适应的匹配算法,提高查询的匹配效率,减少系统的开销。为了使系统能够充分复用已执行查询的结果,本文提出对多个查询进行预处理的方案,通过改变各查询进入Pig编译器进行编译的顺序,从而改变Job的执行顺序,使得加载相同数据集的Job同时执行,减少与存储库进行匹配的次数。实验表明:在构建存储结构与匹配已有结果过程中,本文提出的方法与ReStore相比,节约16.3%的时间开销,伸缩性也更好。  相似文献   

8.
当前的大规模数据分析通常在MapReduce框架下执行查询,由于MapReduce框架本身的冗余性以及查询之间的重叠性,复用已有查询的结果可以大幅提高查询的执行效率。复用查询的结果需要对其进行存储和匹配管理,产生高昂的系统开销,抵消复用的部分效果。针对目前先进的查询结果复用系统Re Store在管理查询结果和匹配中存在的效率低下的问题,提出森林结构的Job存储管理技术和与之相适应的匹配算法,提高查询的匹配效率,减少系统的开销。为了使系统能够充分复用已执行查询的结果,提出对多个查询进行预处理的方案;通过改变各查询进入Pig编译器进行编译的顺序,从而改变Job的执行顺序,使得加载相同数据集的Job同时执行,减少与存储库进行匹配的次数。实验表明,在构建存储结构与匹配已有结果过程中,提出的方法与Re Store相比,节约16.3%的时间开销,伸缩性也更好。  相似文献   

9.
不同于Surface Web的信息获取方式,Deep Web中用户需通过查询接口才能得到其中的数据.查询接口一般形成属性间复杂的m∶n匹配.为统一相同领域的查询接口,提出了一种基于关联规则的匹配方法,从整体上双重匹配成组属性和同义属性,很好地实现了同一领域中查询接口的整合问题.特别对于大量的数据源时,无论是准确率还是效率都比传统的方法有很大的提高.  相似文献   

10.
基于拼音索引的中文模糊匹配算法   总被引:3,自引:0,他引:3  
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。  相似文献   

11.
刘钟涛  王虹 《河南科学》2013,(12):2186-2189
Apfiofi算法是数据挖掘技术中关联规则的经典算法,为了解决在入侵检测系统中使用Apfiofi算法进行模式匹配的低效率问题,提出了针对Apfiofi算法的优化,提出一种基于基于事务压缩和项目压缩的优化算法,该优化算法比Apriori算法具有明显的效率,提高了模式匹配的精度.  相似文献   

12.
几种设计模式在调度前置机软件设计中的应用   总被引:2,自引:0,他引:2  
为了实现电力调度前置机子系统软件的灵活性、重用性和有效性,对几种面向对象的设计模式在前置机软件设计中的具体应用作了介绍.主要应用策略(Strategy)模式解决了RTU、FTU的连接问题,应用了代理(Proxy)模式解决了代理通道的问题,应用中介者(Mediator)模式解决了前置机和其他的系统接口问题,使前置机软件有效、可靠地运行.  相似文献   

13.
虹膜识别方法是近年来新兴的一种生物识别技术,它主要由四个部分组成[1]。本文主要对Daugman识别系统的匹配过程进行研究。对于由来自323个人的592个虹膜记录组成的数据库,这种匹配方法具有良好的匹配性;当面临较大的数据记录时,这种匹配方法也存在不足。本文据此提出了相应的改进措施。  相似文献   

14.
分析了Horspool算法的原理及特点,提出了一种适用于方块苗文环境的字符串模式匹配算法.该算法结合方块苗文的编码方式及字符串查找的特点,通过对Horspool算法中的字符处理单位进行扩展来适应方块苗文的字符串匹配.实验结果表明,在单字词、双字词和多字词的方块苗文字符串匹配过程中,该算法均呈现出较好的性能,能够用于解决方块苗文的快速检索问题.  相似文献   

15.
几何图形的匹配识别   总被引:2,自引:0,他引:2  
提出了一种二维不规则几何图形之间的匹配性判断的方法,以便解决二维不规则几何图形间的模式识别和模式分类问题,可用于数控切割机排样的样图图形数据库的几何图形分类及自动检索。  相似文献   

16.
楞次定律是电磁学教学中的难点 .针对这一问题讨论了楞次定律的教法 .  相似文献   

17.
本文论述了利用矩阵和1—1规划方法,建立模型库及其管理软件,根据到解列车的车辆方向号和到达时间,是否与出发列车相匹配以及上、下行系统交换车数量的多少等条件,判明到解列车应接入的车场及其解体顺序,较好地解决了车流接续这一编制日班计划和站调日常指挥的核心问题.  相似文献   

18.
在XML数据清洗中,模式约束语言提供的信息不能满足准确数据清洗过程对于领域知识的需要;同时,传统的树编辑算法在对XML实例数据进行清洗时,由于缺乏对XML结构信息的语义描述,造成了大量的数据匹配错误.基于此,引入参考本体和领域本体分别对上述问题进行解决,给出了模式约束的度量指标和一个XML结构感知算法,并构建了一个基于语义的XML数据清洗框架.  相似文献   

19.
伍铁斌 《科学技术与工程》2012,12(30):8006-8009
针对锌湿法冶炼锑盐净化除钴过程锌粉添加量难以优化设定的问题,采用改进的操作模式方法优化设定锌粉添加量。引入PCA方法确定属性权重系数,得到改进的欧氏距离计算操作模式之间的相似度,能有效克服噪声干扰,极大提高了模式匹配精度。仿真结果表明,采用该优化方法设定反应器的锌粉添加量,在保证钴离子浓度达标的同时,能有效地节约锌粉,为锑盐净化除钴操作参数的设定提供了新的思路。  相似文献   

20.
一种改进的KMP高效模式匹配算法   总被引:9,自引:0,他引:9  
针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳跃k个值,且使模式串的指针置于起始位置,开始新一轮的匹配,加快了主串的匹配速度.理论分析和试验证明,该算法需要的比较次数比KMP算法减少将近一半.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号