首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了解决网络深度检测系统中字符串匹配的速度瓶颈问题,提出了一种新的确定性有限状态自动机(DFA)实现结构,以及状态转移表静态Cache策略.该方法基于软硬件协同设计思想,从系统优化的角度综合网络处理器(NP)和字符串匹配算法特点.所提出的基于NP优化的AC算法(NP-AC)与标准Aho-Corasick(AC)算法相比,降低了访问外存次数和总的存储需求,提高了处理单元的利用率和吞吐量.测试表明,在单片Intel IXP2800网络处理器上NP-AC算法可以达到6.4 Gb/s的处理能力.  相似文献   

2.
3.
字符串匹配是计算机科学研究的基础问题,主要研究在目标字符串中发现多特征字符串。其被广泛用于网络审计系统等其他实际工程中的应用中。目前,对于特征字符串集合匹配的问题的研究较少,在实际中也没有很理想的算法,因此在基于BM和AG算法研究的基础上,提出了一种基于排序树的快速匹配算法,通过与其它算法比较以及实验研究,表明本算法效率有了很大的提高。图6,参10。  相似文献   

4.
本文提出了一个串匹配的新算法,该算法适合于当主串与子串不存在许多“部分匹配”时的情况,它是对串匹配算法中,一般算法和KMP算法的补充。  相似文献   

5.
一种快速的多模式字符串匹配算法   总被引:15,自引:0,他引:15  
以基于有限自动机的多模式匹配算法(DFSA)为基础,结合Boyer-Moore(BM)和Quick Search(QS)快速单模式匹配算法的优点,提出了一种快速的多模式字符串匹配算法,在一般情况下,该算法不需要匹配目标文本中的每个字符,能充分利用匹配过程中本次匹配不成功的信息和已经匹配成功的信息,跳过尽可能多的字符。实验表明,模式串较短时,本算法所需时间为DFSA算法的1/2-1/3;模式串较长时,本算法所需时间为DFSA算法的1/2-1/3;模式串较长时,其所需时间为DFSA算法的1/3-1/5。  相似文献   

6.
针对Sunday匹配算法在首字符和正文存在大量重复,使得其平均执行效率降低这一问题,提出了一种改进的Sunday算法。首先将重复的首字符压缩为一个字符,然后使用压缩后的字符串和正文进行匹配,若匹配成功,对成功匹配的位置信息前的字符和首字符进行循环匹配;如果匹配位数和模式串相同,则返回成功,否则返回失败。改进后的算法大大减少了匹配次数,使执行速度有了明显的提高。  相似文献   

7.
针对信息处理中常见的字符串匹配问题,通过对经典的Brute Force算法和KnuthMorris-Pratt算法进行分析,根据GPU异构并行计算任务的分配特性,设计一种针对Knuth-Morris-Pratt算法的数据重叠划分并行方案,并提出一种基于移动平台的异构并行字符串匹配算法KMP_MOP.在PowerVR移动平台环境下使用千万级长度的字符串数据对算法的性能进行测试,同时对算法在其他平台的执行情况进行比较,验证了并行算法的性能可移植性.实验结果表明,KMP_MOP算法能充分利用移动平台中的GPU性能,有效提高具有GPU的移动平台设备的字符串匹配效率.  相似文献   

8.
9.
分析了BM和KMP算法特点,阐述了字符串匹配算法在文本处理领域、信息检索、语义学、分子生物学等学科中应用的意义,对字符串中最有影响的KMP算法、BM算法、RK随机算法和SUANDAY算法以及由此而产生的一些改进算法进行研究,实现了实验分析及功能对比,并指明各算法的适用性.  相似文献   

10.
改进的Wu-Manber多模式串匹配算法   总被引:8,自引:0,他引:8  
为提高串匹配算法在实际应用中的运算性能,对W u-M anber算法进行了改进。吸收了Q S(Q u ick Search)算法的思想,并利用匹配过程中匹配失败的信息,达到最大跳跃距离,实现了快速的多模式匹配算法。对改进后的算法和W u-M anber算法进行对比实验,当最小模式长度较大时,改进后的算法性能与原算法基本相同;而当模式最小长度较小时(<9),改进后的算法比原算法有显著提高,用于英文文本时比原算法的所用时间平均减少了8%~20%,用于中文文本时平均减少了15%~30%。  相似文献   

11.
本文对入侵检测技术及其分类进行了概述,简要介绍了模式匹配的方法,并对改进的内容匹配技术以及改进的AC-BM字符串匹配算法进行了详细论述、分析,总结了其优缺点。  相似文献   

12.
本文通过对特征字符串匹配在P2P流量控制中的应用的说明,阐述了如何用主要数据包来识别P2P数据流及提高P2P流量的方法。  相似文献   

13.
马伟华  刘玉梅  叶飞  杨旭东 《应用科技》2007,34(10):32-34,38
在分析Wu—Manber算法的基础上,结合QS算法思想,设计了一种改进的多模式串匹配算法:QWM(quick Wu—Manber).算法充分利用紧邻当前窗口之后的B字符块,使算法的最大移动距离由原来的(m—B+1)增大至(m+B),平均移动距离也得到很大提高.同时对QWM算法和Wu-Manber算法进行了实验对比,无论模式串数量和最小长度怎么变化,性能都有较大提升.实验表明,改进的算法在对英文文本进行扫描时有4%~13%的提高.  相似文献   

14.
在基于特征词遍历匹配的文本分类算法中,字符串匹配算法的选取及相似度阈值控制对文本分类结果起着决定性的作用。针对三种常用的字符串匹配算法做了分析及对比实验,选取了最适合政策文本分类的一种字符串匹配算法。并通过研究政策文本具有的特征提出了一种基于特征词加权的相似度阈值计算方法,经实验证明相似度阈值符合分类要求。  相似文献   

15.
本文描述了一种对网络流式数据实时监控的搜索算法,应用有限自动机的原理.实现对任意长度数据流进行多关键字无回溯单遍匹配扫描,且加入概率计算,在一定程度上实现文本的简单模糊语义分析。该算法已被网络过滤软件使用,并有良好表现。  相似文献   

16.
KMP扫描算法的改进   总被引:3,自引:0,他引:3       下载免费PDF全文
通过对字符串模式匹配BF和KMP算法的分析,提出了改进KMP扫描算法的方法,并通过对算法的复杂性进行分析,结果表明:改进后的算法KMPA比算法KMP更有效。  相似文献   

17.
正则表达式由于其强描述能力和灵活性,在信息检索,程序设计,数据挖掘,深度分组检测,生物信息处理等领域得到了广泛而深入的应用,然而正则表达式,尤其是正则表达式集合,由于搜索速度慢往往成为系统的性能瓶颈。现有的正则表达式搜索算法性能较好的是多模式过滤类型的算法,此类算法严重依赖于两个因素,从NFA的初始状态到终止状态的最短路径Lmin和正则表达式所表达的语言的前缀集合Pref(RE)的大小,Lmin越长,搜索速度越快,Pref(RE)越大,搜索速度越慢。针对上述问题提出了一种基于Bloom filter的正则表达式集合搜索算法,此方法利用Bloom filter的集合查询时间集合大小无关的特点,使得正则表达式搜索速度不受Pref(RE)大小的影响,如果采用多个Bloom filter并行,还可以间接增大Lmin的长度。分析与测试结果表明,本算法较大的加快了正则表达式的搜索速度,对于正则表达式集合,算法性能改善尤其明显,可以实现大规模正则表达式集合的快速搜索。  相似文献   

18.
周李涌  高鹭 《科技资讯》2009,(29):198-198
KMP算法是字符串模式匹配算法中效率较高且比较难懂的算法;本文从分析算法思想入手,设计相关例题以期掌握手工算法,进而全面掌握算法本身。  相似文献   

19.
相似字符串的比较方法   总被引:1,自引:0,他引:1  
本文尝试给出了一个字符串相似程度的数学定义,推导其性质,然后给出了一个应的算法及实现该算法的具体程序,并分析算法的特点。  相似文献   

20.
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号