首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
一种快速的多模式字符串匹配算法   总被引:15,自引:0,他引:15  
以基于有限自动机的多模式匹配算法(DFSA)为基础,结合Boyer-Moore(BM)和Quick Search(QS)快速单模式匹配算法的优点,提出了一种快速的多模式字符串匹配算法,在一般情况下,该算法不需要匹配目标文本中的每个字符,能充分利用匹配过程中本次匹配不成功的信息和已经匹配成功的信息,跳过尽可能多的字符。实验表明,模式串较短时,本算法所需时间为DFSA算法的1/2-1/3;模式串较长时,本算法所需时间为DFSA算法的1/2-1/3;模式串较长时,其所需时间为DFSA算法的1/3-1/5。  相似文献   

2.
在基于有限状态自动机的多模式匹配算法(DFSA算法)基础上,结合Tuned BM算法的优点,提出一种快速的多模式字符串匹配算法,实现了多模式匹配过程中不匹配字符的连续跳跃.在一般情况下,算法不需要匹配目标串中的每个字符,而是在实际比较之前跳过尽可能多的字符,以减少字符比较的操作,实现快速匹配.在模式串较长和较短的情况下,算法都有很好的性能.分析指出算法实际比较的字符数随着模式串长度的增加而下降,并随模式集的增大有所增多.实验表明,在模式串较短时,算法需要的匹配时间仅为AC算法的50%到33.3%,AQR算法的90%左右;在模式串较长时,所需时间为AC算法的25%至12.5%,AQR算法的75%左右.  相似文献   

3.
字符串的模式匹配应用十分广泛,在信息的搜索查询等方面具有重要作用,研究串匹配算法的效率具有重要的理论价值和实际意义。在分析几种经典模式匹配算法的基础上,对当前应用最广泛的Sunday算法提出了改进的算法Zhusunday.算法主要改进之处是:在字符串从右向左匹配过程中,当文本字符中出现不匹配模式字符串的字符且该文本字符不是坏字符时,算法从右向左搜索当前文本字符在模式串中出现的位置;找到当前字符在模式串中的位置后继续再向左匹配模式串字符一次,如果仍不匹配时,模式窗口比Sunday算法多向右移动一个字符。改进的算法提高了模式匹配的执行效率,通过大量对比实验证明了该算法的有效性。最后得出结论:在实际应用中,坏字符大量存在的情况下,改进算法的最优时间复杂度可达O(n/m),在同一时间复杂度下,比Sunday算法效率提高25~50%.  相似文献   

4.
为提高模式匹配算法性能,介绍经典的模式匹配算法Byoer-Moore和Sunday,分析它们改进后的效率,根据分块法的特点,提出一种新的分块模式匹配(block pattern matching,BPM)算法?BPM算法在预处理阶段先确定模式串的首字符在文本串的位置,再确定此字符后长度等于模式串长度的字符是否等于模式串的尾字符,若符合条件,采用单链表存储结构进行存储,在匹配阶段,利用单链表信息进行双向匹配?实验结果表明,BPM算法大大减少了匹配次数和字符比较个数,从而提高匹配效率?  相似文献   

5.
分析了几种常用的模式匹配算法,提出一种适合于中文的基于KMP的改进算法,即双向比较模式匹配算法.该算法以KMP算法为基础,引入特征数组以记录模式串尾字符在模式串中出现的位置信息,从而获得模式串在匹配过程中的最大移动距离和最少比较次数.实验结果表明,双向比较模式匹配算法可有效降低匹配次数.  相似文献   

6.
面向入侵检测系统的模式匹配算法研究   总被引:4,自引:0,他引:4  
针对入侵检测系统对基于攻击特征的网络数据包的检测效率低和丢包率高的问题,在分析典型的模式匹配算法的基础上,提出了一种Boyer Moor Horspool Fast(BMHF)匹配算法.引入一个新的判断函数Q(X)指出字符X在模式串中出现的次数,当出现次数为1时可以利用已匹配的信息加大移动距离,同时利用文本串中不匹配字符后面的一个字符进行匹配,从而得到一个移动距离.将不同移动规则下获得的移动距离的最大值作为实际的移动距离,依次进行,直到匹配完成.实验结果表明,BMHF算法的CPU运算时间比典型的模式匹配算法可平均节省5.7%,平均匹配次数减少12.5%.  相似文献   

7.
张磊  陈娜 《科技信息》2010,(16):213-213
对SNORT的原有规则匹配算法BM算法改进,利用规则树实现了BM算法的多模式匹配功能,在跳跃方面主要依靠于最短模式串与规则树首字符重复出现间隔距离双重控制,在首字符不匹配的情况下,移动模式串的最大距离就是前缀树中最短模式串长度,在整个匹配过程中,最大移动距离是由该前缀树中最短模式串的长度决定;而首字符匹配时,最大移动距离是由规则树首字符重复出现间隔距离决定。  相似文献   

8.
一种改进的KMP高效模式匹配算法   总被引:9,自引:0,他引:9  
针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳跃k个值,且使模式串的指针置于起始位置,开始新一轮的匹配,加快了主串的匹配速度.理论分析和试验证明,该算法需要的比较次数比KMP算法减少将近一半.  相似文献   

9.
模式匹配是获取不同模式间语义关联关系的技术,是数据集成过程中的关键操作.随着可检索在线数据库数量的迅速增加,大规模的模式匹配工作的需要使多源模式匹配方法成为模式匹配领域研究的重点.针对现有多源模式匹配方法的缺陷,本文提出了一种基于素数的多源模式匹配方法,并提出了具体算法-PMSM.该方法将素数理论引入模式匹配过程中,使单纯的字符匹配转换为素数计算,提高了匹配效率,同时保留了现有多源模式匹配方法的优点.实验证明,PMSM切实可行.  相似文献   

10.
通过构建前缀匹配自动机,使得每轮匹配后下个匹配窗口的文本总是保持左端部分为模式的一个前缀、右端部分全为未比较过的字符的形式.对于与此相应的模式匹配算法,已证明文本内的每个字符在整个匹配过程中最多被比较一次,从而字符总比较次数不超过n,已达到任意算法最坏情况下字符总比较次数的最小值.另外,在适当条件下还从理论上证明了此算法的亚线性(即字符总比较次数小于cn,其中常数c<1).根据实验结果,算法的实际运行速度快于Boyer-Moore算法.  相似文献   

11.
分析了Horspool算法的原理及特点,提出了一种适用于方块苗文环境的字符串模式匹配算法.该算法结合方块苗文的编码方式及字符串查找的特点,通过对Horspool算法中的字符处理单位进行扩展来适应方块苗文的字符串匹配.实验结果表明,在单字词、双字词和多字词的方块苗文字符串匹配过程中,该算法均呈现出较好的性能,能够用于解决方块苗文的快速检索问题.  相似文献   

12.
针对殷墟甲骨文字整理过程中大量模糊字形难以识别的问题,提出了一种基于语境的统计分析和Hopfield网络相结合的模糊匹配识别方法。该方法利用语境分析生成的候选字库得到对应的甲骨文语义构件向量,然后结合基于Hopfield网络的识别结果计算待识别的甲骨文模糊字的匹配度,根据匹配度确定目标甲骨字。实验表明,该方法对部分甲骨拓片的模糊甲骨字识别效果较好。  相似文献   

13.
字符匹配效率是很多计算机应用系统的性能瓶颈,研究设计高效的匹配算法有助于提高相应系统的应用性能。在分析典型Sunday匹配算法的基础上,对其进行了较为有效的改进。改进算法在字符串匹配前先计算模式串的倒序特征值,也就是以此计算出模式串的最后s个字符在本模式串中倒序除自己以外的下一次出现的位置。每一次字符匹配都采用倒序匹配并利用这种匹配的结果,匹配结果结合倒序特征值可以直接决定特征串的下一次位移数。在进行完一次字符匹配后,采用增加一个遍历字符的Sunday算法来遍历模式串以计算下一次位移数,以此尽可能地排除无效匹配。实验结果表明改进算法的效率比Sunday算法有一定提高。  相似文献   

14.
基于多尺度模板匹配和部件模型的车牌字符分割方法   总被引:2,自引:0,他引:2  
为提高车牌字符分割的准确率,提出了一种基于多尺度模板匹配和部件模型的车牌字符分割方法. 对单层车牌,根据车牌结构特征建立多尺度模板作用于车牌候选区域,通过投影得分估计出最佳模板对应的尺度和位置信息;对双层车牌,使用部件模型对双层车牌进行建模,双层车牌的上层字符区域和下层字符区域分别对应部件模型的一个部件,通过多尺度的模板匹配得到上下层部件的候选集合,利用部件模型中部件之间的几何约束得到最终的车牌字符分割结果. 实验结果表明,所提出的方法可以有效进行单/双层车牌的字符分割.   相似文献   

15.
汉字的层次轮廓特征及其应用   总被引:5,自引:0,他引:5  
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。  相似文献   

16.
基于双目视觉的水泥混凝土路面错台检测方法   总被引:2,自引:1,他引:1  
针对水泥混凝土路面错台测量手段的不足,提出了一种基于双目视觉的错台测量方法.该方法根据双目摄像机的成像特点和水泥混凝土路面的图像特征,对接缝位置进行定位和错台计算.定位分为2个主要步骤,一是基于灰度投影的粗定位,二是在粗定位的基础上提取接缝附近图像,利用灰度投影和边缘投影精定位.由双目视觉测量系统计算相邻2块水泥板在错台附近点的三维坐标,利用这些坐标计算错台量,其中关键环节是在双目图像匹配时提出了一种基于匹配点位置估计的匹配算法.试验表明,与直尺测量结果吻合.  相似文献   

17.
字符串匹配是计算机科学研究的基础问题,主要研究在目标字符串中发现多特征字符串。其被广泛用于网络审计系统等其他实际工程中的应用中。目前,对于特征字符串集合匹配的问题的研究较少,在实际中也没有很理想的算法,因此在基于BM和AG算法研究的基础上,提出了一种基于排序树的快速匹配算法,通过与其它算法比较以及实验研究,表明本算法效率有了很大的提高。图6,参10。  相似文献   

18.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号