首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
孙靖怡  陶振凯 《科技资讯》2007,(30):151-152
目前,众多、分散、同源数据的不规范现象给数据的比对整合造成了很多麻烦,本文针对这一问题,把数据中的文字信息看作字符串序列,使用动态规划处理法计算字符串序列的操作距离,并根据操作距离判断得出文字信息比对的相似率,以此判断其同源性.  相似文献   

2.
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.  相似文献   

3.
Python语言是一个强大的面向对象程序设计语言,具有可扩展性,可嵌入性,以及丰富的计算生态等特点,目前已广泛应用于各个领域.但其高度的抽象却带来巨大的性能代价.如何进行高性能编程是亟待深入研究的方向.字符串操作是数据处理中最常见的,针对字符串拼接操作的三种方式进行实验对比,这次实验研究对于使用Python作为大数据处理工具的代码优化具有一定的指导意义.  相似文献   

4.
对于给定的两个字符串集合,基于相似度的连接操作可用于从中找出相似的字符串对,该操作是数据清洗、数据集成以及协同过滤等应用中的核心操作之一,其执行效率直接影响系统的整体性能。本文提出一种高效计算字符串集合间连接操作的算法Trie-TSS,该方法基于trie树进行处理,利用对称性来减少冗余计算。提出一种旨在减少冗余编辑距离计算操作的优化技术来进一步提升系统性能。最后通过实验验证了Trie-TSS算法的高效性。  相似文献   

5.
分析了Horspool算法的原理及特点,提出了一种适用于方块苗文环境的字符串模式匹配算法.该算法结合方块苗文的编码方式及字符串查找的特点,通过对Horspool算法中的字符处理单位进行扩展来适应方块苗文的字符串匹配.实验结果表明,在单字词、双字词和多字词的方块苗文字符串匹配过程中,该算法均呈现出较好的性能,能够用于解决方块苗文的快速检索问题.  相似文献   

6.
格式化字符串漏洞是一种常见的危害较大的软件漏洞.现有格式化字符串漏洞自动验证系统未充分考虑参数存储位置位于栈以外空间的情况,造成对该部分漏洞可利用性的误判.针对该问题,论文设计实现了一种基于符号执行的格式化字符串漏洞自动验证方法,首先根据参数符号信息检测当前格式化字符串函数漏洞,然后分别构建参数存储于不同内存空间情况下的漏洞验证符号约束,最后利用约束求解自动得到漏洞验证代码,实现了格式化字符串漏洞的自动验证.在Linux系统下对不同类型测试程序进行了实验,验证了方法的有效性.  相似文献   

7.
格式化字符串攻击检测与防范研究   总被引:1,自引:0,他引:1  
从攻击原理、攻击检测与攻击防范角度研究格式化字符串攻击.文中首先比较了格式化字符串攻击和缓冲区溢出攻击的联系与区别,总结了*printf()系列函数与格式化字符串攻击相关的3条特殊性质以及6种格式化字符串攻击的方法.采用基于源代码的检测方法对格式化字符串漏洞进行检测,并阐述了漏洞检测方法的原理和关键代码.最后对格式化字符串攻击的3种防范技术FormatGuard、Libsafe和White-Listing进行了比较研究,特别对Linux下的基于动态链接库的保护方法Libsafe的原理及其对格式化字符串攻击的防范策略采取的3个步骤进行了详细分析.  相似文献   

8.
ASP与Oracle数据库的有效连接是许多互联网应用开发者十分困惑的问题.文章首先从技术形成的历史角度研究了网络数据库的连接问题,分析并得出ASP连接Oracle数据库的几种重要技术与方法,并给出关键的连接字符串,最后比较几种连接字符串下的连接性能.  相似文献   

9.
针对信息处理中常见的字符串匹配问题,通过对经典的Brute Force算法和KnuthMorris-Pratt算法进行分析,根据GPU异构并行计算任务的分配特性,设计一种针对Knuth-Morris-Pratt算法的数据重叠划分并行方案,并提出一种基于移动平台的异构并行字符串匹配算法KMP_MOP.在PowerVR移动平台环境下使用千万级长度的字符串数据对算法的性能进行测试,同时对算法在其他平台的执行情况进行比较,验证了并行算法的性能可移植性.实验结果表明,KMP_MOP算法能充分利用移动平台中的GPU性能,有效提高具有GPU的移动平台设备的字符串匹配效率.  相似文献   

10.
随着J2ME在开发移动设备上应用的增多,游戏开发已成为当前的主要应用领域之一.然而,针对在游戏开发中经常需要绘制长字符串的问题,J2ME并没有提供相应的解决方法.对此,通过设计一种切割字符串的算法来解决该问题.实验结果表明此算法是有效的.  相似文献   

11.
在编写C程序时经常会用到字符数据和字符串,很多人在进行程序设计时很容易混淆字符和字符串的处理方法,因此笔者从字符和字符串的定义、存储、输入和输出方法几个方面阐述其异同,在程序设计时能正确使用字符或字符串解决实际问题。  相似文献   

12.
利用声波通过钻柱传输井下信息,具有得天独厚的信道条件,但是声波在钻柱中的传播特性还没有得到充分的研究,尤其是贴近工程应用的实验研究。依托低频宽带换能器建立了测试声波在钻柱信道中传输的实验装置,基于该装置对换能器声波信号的传输特性进行了实验研究及分析。结果表明:随着换能器激励电压的增大接收信号幅值呈现增大趋势,当电压大于130 V时接收信号幅值趋近饱和。理论和实验分析得到的频域特性均表现出明显的梳状滤波特性;但具体通阻带分布和结构形式存在差异,实际钻柱信道的频域特性更为复杂。由于换能器非线性特性和钻柱信道频带特性共同作用,对于实验用低频宽带换能器,选取3 100 Hz以内频率,并结合正交频分复用编码技术可极大增强声波传输的速率和适用性。  相似文献   

13.
提出了一种基于CRC的文本脆弱水印算法.利用CRC差错检测方法,该算法将要保护的文本按m个文字一个级联分成若干个级联,将每个级联与密钥合成后的位串除以设定的生成多项式,再把6位的余式位串分成三组,作为水印信息嵌入到级联的最后一个文字的RGB的三个分量.提取水印时,将该级联的余式位串求出.如果与提取的水印相同,则认为此级联没有纂改,否则有纂改.该方法检测到纂改的概率为1-1/26m,并且至少能将纂改定位于级联内.  相似文献   

14.
视半无界弦为无界弦x>0的部分,半无界弦的自由振动问题可以通过适当延拓,用达朗贝尔公式求解.对应于第一类、第二类齐次边界条件的半无界弦自由振动问题的延拓应该具有更一般的形式,而不是只能采用奇延拓或偶廷拓.定解问题的衔接条件要求延拓具有连续性.  相似文献   

15.
本文提出一种属性链匹配识别自由手写数字的方法,以带有属性的基元描述待识字符,粗分类后的一般类字符用属性链匹配法识别.  相似文献   

16.
针对无限制手写体数字字符的识别问题进行了探讨.输入图像经过预处理后。进行特征抽取及分域处理.每一区域内对应一类基元、基元的类别由特征组合情况来确定.对骨架的拓扑结构进行全面描述.形成输入字符图像的一维链码.以此与参照链相匹配.根据匹配结果。进行识别.  相似文献   

17.
为提高模式匹配算法性能,介绍经典的模式匹配算法Byoer-Moore和Sunday,分析它们改进后的效率,根据分块法的特点,提出一种新的分块模式匹配(block pattern matching,BPM)算法?BPM算法在预处理阶段先确定模式串的首字符在文本串的位置,再确定此字符后长度等于模式串长度的字符是否等于模式串的尾字符,若符合条件,采用单链表存储结构进行存储,在匹配阶段,利用单链表信息进行双向匹配?实验结果表明,BPM算法大大减少了匹配次数和字符比较个数,从而提高匹配效率?  相似文献   

18.
引入了一类广义强向量均衡问题,它是非常一般的包括许多强向量均衡问题、强向量似变分不等式、强向量变分不等式等问题作为特殊情形.利用Brouwer不动点定理在没有任何单调性的条件下证明了这类广义强向量均衡问题解的存在性,推广了这个方向的一些结果.  相似文献   

19.
字符匹配效率是很多计算机应用系统的性能瓶颈,研究设计高效的匹配算法有助于提高相应系统的应用性能。在分析典型Sunday匹配算法的基础上,对其进行了较为有效的改进。改进算法在字符串匹配前先计算模式串的倒序特征值,也就是以此计算出模式串的最后s个字符在本模式串中倒序除自己以外的下一次出现的位置。每一次字符匹配都采用倒序匹配并利用这种匹配的结果,匹配结果结合倒序特征值可以直接决定特征串的下一次位移数。在进行完一次字符匹配后,采用增加一个遍历字符的Sunday算法来遍历模式串以计算下一次位移数,以此尽可能地排除无效匹配。实验结果表明改进算法的效率比Sunday算法有一定提高。  相似文献   

20.
在分析了BM算法以及一些重要的改进算法的基础上,提出一种新的改进算法—Y_BMHS 算法.该算法利用辅助的二维数组,考虑了文本串后间隔的两位字符和模式串首字符的唯一性,使 得最大位移提升到m+3,出现概率也显著提高,加快了匹配速度.实验证明Y_BMHS算法比BM、 BMH、BMHS等算法有更好的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号