共查询到20条相似文献,搜索用时 15 毫秒
1.
一种快速的字串交叉模式匹配算法 总被引:7,自引:0,他引:7
介绍了一种基于高频字串提取的快速字串交叉模式匹配算法,同已有的KMP,BM等单模式匹配算法和有限自动机等多模式匹配算法相比,在字符集∑较大且字串个数远大于字串最大长度的情况下,该算法具有较低的时间复杂度和空间复杂度,并适用于字符集较大,词长较短的文本处理。 相似文献
2.
李映刚 《四川理工学院学报(自然科学版)》2013,26(2):78-81
字符匹配效率是很多计算机应用系统的性能瓶颈,研究设计高效的匹配算法有助于提高相应系统的应用性能。在分析典型Sunday匹配算法的基础上,对其进行了较为有效的改进。改进算法在字符串匹配前先计算模式串的倒序特征值,也就是以此计算出模式串的最后s个字符在本模式串中倒序除自己以外的下一次出现的位置。每一次字符匹配都采用倒序匹配并利用这种匹配的结果,匹配结果结合倒序特征值可以直接决定特征串的下一次位移数。在进行完一次字符匹配后,采用增加一个遍历字符的Sunday算法来遍历模式串以计算下一次位移数,以此尽可能地排除无效匹配。实验结果表明改进算法的效率比Sunday算法有一定提高。 相似文献
3.
母泽平 《重庆工商大学学报(自然科学版)》2014,(8):79-82
分析了BM和KMP算法特点,阐述了字符串匹配算法在文本处理领域、信息检索、语义学、分子生物学等学科中应用的意义,对字符串中最有影响的KMP算法、BM算法、RK随机算法和SUANDAY算法以及由此而产生的一些改进算法进行研究,实现了实验分析及功能对比,并指明各算法的适用性. 相似文献
4.
目前的入侵检测系统大多是基于特征的,系统的性能瓶颈在于模式匹配算法的执行效率.在探讨几种典型的模式匹配算法的基础上,提出了改进的BMH算法.该算法通过取文本串中的两个连续字符计算偏移量的方式,减少了匹配的次数.实验结果证明匹配速度得到了一定程度的提高. 相似文献
5.
大字符集语言单模式匹配算法 总被引:1,自引:0,他引:1
分析了大字符集的特点和人类查找字符串的过程,提出了一个新的单模式匹配算法,该算法利用字频和已成功匹配的前、后缀信息对模式串进行预处理。在查找阶段,运用了连续跳跃的思想。实验表明,本算法比其他同类算法更加高效。 相似文献
6.
一种快速单模式准确匹配算法 总被引:4,自引:0,他引:4
引入连续跳跃查找文本的思想,提出了一种新的单模式精确匹配算法,其最优条件下的时间复杂度为O[n/(m 1)],新算法的平均时间复杂度分析表明其具有优越的查找性能,对比实验结果显示,新算法的性能优于目前所见的同类算法,特别是在模式较短的情况下,优势更为明显,这一特点非常适合于自然语言文本的检索。 相似文献
7.
钟昌振 《湖南工程学院学报(自然科学版)》2006,16(4):59-61,86
开发了基于模式匹配的目标点数算法.算法通过对图像中的目标进行模式匹配处理,自动识别目标,实现目标的点数功能.该算法避免了傅立叶变换滤波等计算量较大算法的使用,适用于利用图像处理进行目标实时点数的领域. 相似文献
8.
9.
庞善臣 《山东科技大学学报(自然科学版)》2004,23(3):46-48
采用文献[11]求解子串前缀的方法,给出了BM算法一个改进算法。改进算法最坏情况下的时间复杂度达到O(m*n/k),有效地减少了字符重复比较的次数,提高了匹配效率。 相似文献
10.
基于混合策略的单模式匹配算法 总被引:2,自引:0,他引:2
结合后缀有限自动机和正向有限自动机的优点,提出了两个单模式匹配算法.算法中,无论是后缀自动机还是正向有限自动机,只要扫描到的模式前缀长度R>0或者超过模式长度的1/2时,使用正向有限自动机继续向右进行扫描;否则都滑动m-R个字符,使用后缀自动机反向扫描模式串的前缀.两个算法的最差、最好时间复杂度分别为O(n)和O(n/m).结果表明,在短模式的情况下,两个算法的平均时间复杂度均好于RF和LDM,在小字符集长模式或大字符集短模式的情况下它们的平均性能好于BM. 相似文献
11.
为进一步提升传统的近似模式匹配问题解决方法——动态规划算法的性能,提出了一种新的过滤型近似模式匹配算法.该算法结合动态规划算法,切分模式串得到长度相等且更小的模式片;在此基础上将待匹配的文本串分割成子串,并建立相应的索引;同时设计了一个新的过滤策略来消除匹配检查中的冗余.通过实例将文中方法与现有方法进行对比,结果表明:文中方法的匹配时间较短,匹配性能优于现有方法;随着模式串长度的增加,文中算法的优越性更为明显,模式串长度大于45后,文中算法的匹配时间可比传统动态规划算法缩短一半以上. 相似文献
12.
分析了Horspool算法的原理及特点,提出了一种适用于方块苗文环境的字符串模式匹配算法.该算法结合方块苗文的编码方式及字符串查找的特点,通过对Horspool算法中的字符处理单位进行扩展来适应方块苗文的字符串匹配.实验结果表明,在单字词、双字词和多字词的方块苗文字符串匹配过程中,该算法均呈现出较好的性能,能够用于解决方块苗文的快速检索问题. 相似文献
13.
一种面向中文的快速字串多模式匹配算法 总被引:7,自引:0,他引:7
针对中文字串匹配问题,提出一种快速模式匹配算法,算法采用新型组合状态自动机,将2个状态组合起来匹配一个双字符,从而解决了双字节符构建完全Hash表时带来的存储空间膨胀问题;同时考虑到待匹配模式串中的字符在大字符集中稀疏分布的特点,尝试将单模式QS匹配算法的思想与DFSA算法进行结合,应用于多模式匹配中,实验结果显示,本算法明显优于DFSA算法,平均所花费时间仅为DFSA算法的45.2%。 相似文献
14.
叶煜 《成都大学学报(自然科学版)》2011,30(3):236-238
分析了几种常用的模式匹配算法,提出一种适合于中文的基于KMP的改进算法,即双向比较模式匹配算法.该算法以KMP算法为基础,引入特征数组以记录模式串尾字符在模式串中出现的位置信息,从而获得模式串在匹配过程中的最大移动距离和最少比较次数.实验结果表明,双向比较模式匹配算法可有效降低匹配次数. 相似文献
15.
一般情况下,哈夫曼编码所采用的存储结构及构树方法,不仅影响编码效率,而且也没充分利用存储空间.本文改顺序存储为链式存储,对叶结点和非叶结点采用不同的存储结构来降低空间复杂度.在编码时,充分利用短码字且基于树型模式匹配进行编码,提高了编码性能和传输效率. 相似文献
16.
一种新的多模式快速匹配算法 总被引:2,自引:0,他引:2
提出了一种针对多模式的快速模式匹配算法。算法分为预处理阶段和匹配阶段两个部分,预处理阶段对所有待匹配的模式进行分析,构造一个关于这些模式的树型有限状态自动机,匹配阶段利用这个模式自动机.对文本串进行一次性的搜索,查找文本是否包含模式集中的模式。为了提高了匹配速度,算法利用已匹配的字符串信息实行跳跃式的比较,避免了文本扫描指针的回溯。 相似文献
17.
对笔者在另一篇文章《一种改进的Wu-Manber多关键字匹配算法》中提出的算法进行了改进,把原算法中next链表中结点的Same-Subsuffix域中分裂成两个子域,使得搜索过程中字符比较的次数进一步减少,从而提高算法的效率.特别是在大规模模式串的情况下新算法的效率比原算法有进一步的提高.实验结果表明,当模式串较少时,新算法效率与原算法相比有一定的损失.而随着模式串的增加,新算法具有更高的效率.因此,新的算法比原算法具有更大的适用范围. 相似文献
18.
模式匹配在中文问答系统中的应用研究 总被引:2,自引:0,他引:2
针对汉语文本,对自动问答系统的实现进行了初步探索,主要是基于向量空间模型对文档信息进行检索,重点研究了模式匹配在判断问句类型和获取答案方面的作用,设计并初步实现了一个面向受限领域内中文自动问答系统。 相似文献
19.
提出了一种基于Boosting的特征筛选算法.根据Boosting分类训练时的训练错误率、训练过程中错误率的收敛速度以及测试错误率确定特征影响因子;利用这些影响因子对待识别目标的特征进行排序,去除冗余特征,以降低特征空间的维数.对于筛选后保留的特征,根据其影响因子进行加权,以提高目标识别的准确率.用该方法可避免其它分类学习器训练时的过学习现象,生成的分类器模型小,识别速度快,适用于对特征不易确定的目标识别. 相似文献
20.
对笔者在另一篇文章《一种改进的Wu—Manber多关键字匹配算法》中提出的算法进行了改进,把原算法中next链表中结点的Same—Subsuffix域中分裂成两个子域,使得搜索过程中字符比较的次数进一步减少,从而提高算法的效率.特别是在大规模模式串的情况下新算法的效率比原算法有进一步的提高.实验结果表明,当模式串较少时,新算法效率与原算法相比有一定的损失.而随着模式串的增加,新算法具有更高的效率.因此,新的算法比原算法具有更大的适用范围. 相似文献