首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
对程序代码抄袭检测中多种字符串匹配算法的实现原理进行了描述,给出匹配算法计算相似度的公式以及相对应的时间复杂度。由于字符串匹配算法在程序代码抄袭检测中应用较为广泛,对其中的B-F(Brute-Force)朴素算法、LCS(Longest Common Subsequence)最长公共字串算法、GST(Greedy String Tiling)贪心字符串匹配算法等经典算法的总结比较是一件有意义的研究工作。  相似文献   

2.
为了实现委托外部检测单位进行的化验任务中古生物代码的导入,设计了基于编辑距离算法的古生物代码匹配方法。该方法在匹配指定古生物代码时,首先计算该古生物代码与本地古生物代码库中各个代码的字符串相似度,然后按照相似度从高到低推荐给用户进行选择。为了提高匹配的效率,在匹配过程中,若找到编辑距离为0的本地代码后即为最佳匹配结果,结束整个匹配过程;此外,对实验人员手工选择的匹配结果进行缓存,以供下次快速匹配。实例分析结果表明,基于编辑距离算法的匹配方法能够精确得到古生物代码之间的相似度,达到了预期的效果。  相似文献   

3.
谷春英  张顺利 《科学技术与工程》2013,(10):2871-2874,2879
恶意程序代码的相似度估计是恶意程序代码分析和检测的重要研究内容。现有的方法主要是对恶意程序代码进行属性计算或结构度量,但由于恶意程序代码结构的灵活性和恶意程序代码的伪装、恶意程序代码的相似度较难度量。提出了改进指纹和LSC加权的恶意程序代码相似度估计算法。该算法首先对恶意程序代码进行函数作用域划分和标准化预处理,然后对其进行字串序列化,利用改进的指纹相似度来对恶意程序代码的相似度进行度量;同时结合最大公共字串匹配算法进行结构度量,并对其相似度计算结果进行加权,对恶意程序代码结构的相似度进行综合估计。实验以C语言结构的程序代码为例,利用折半查找算法生成恶意程序代码测试数据集进行算法有效性验证。仿真证明该算法具有较好的恶意程序代码相似度估算精度。  相似文献   

4.
在基于特征词遍历匹配的文本分类算法中,字符串匹配算法的选取及相似度阈值控制对文本分类结果起着决定性的作用。针对三种常用的字符串匹配算法做了分析及对比实验,选取了最适合政策文本分类的一种字符串匹配算法。并通过研究政策文本具有的特征提出了一种基于特征词加权的相似度阈值计算方法,经实验证明相似度阈值符合分类要求。  相似文献   

5.
基于基本块签名和跳转关系的二进制文件比对技术   总被引:1,自引:0,他引:1  
基于基本块签名和跳转关系的二进制文件结构化比对技术,对已有的二进制结构化比对算法进一步改进,提出一种基于基本块签名和基本块之间跳转关系的函数控制流图比对算法。即首先提取二进制文件反汇编后的函数控制流图信息,然后对图中的基本块进行签名匹配,在签名匹配的基础上再进一步利用邻接矩阵进行边匹配,最后利用匹配的基本块计算函数相似度和文件相似度,并开发出比对工具BinCompae。研究结果表明:相对于源码比对工具和几个常用的二进制补丁比对工具,针对常见的代码抄袭方式,BinCompae均能检测出99%以上的相似度;此外,BinCompare还能检测出语义不变,代码形式改变的抄袭方式。因此,基于基本块签名和跳转关系的结构化比对算法针对二进制文件比对具有很高的准确性和实用性。  相似文献   

6.
一种基于内容相似性的重复视频片段检测方法   总被引:1,自引:0,他引:1  
针对互联网视频内容的复杂性,选择能够表征视频内容的特征,首先通过LSH哈希算法对特征进行索引,并由此确定视频之间的帧匹配序列,然后对于计算出的帧匹配序列,采用随机抽样一致性算法进行拟合,从而得到有效的帧匹配序列.视频之间的相似度依据有效帧匹配序列的相似度计算,由相似度进行互联网视频片段的消重.实验表明,对于大量内容相似的互联网视频片段,该方法能较好地描述相似性,并能有效提高检测准确率.  相似文献   

7.
针对程序代码相似性检测度量忽略程序语义、出现无效度量的问题, 提出一种基于抽象语法树(AST:Abstract Syntax Tree)的程序代码相似性度量方法。通过预处理去除生成AST时的冗余信息, 再进行词法语法分析, 得到相应的AST; 然后通过自适应阈值的选取方式, 利用AST遍历得到的程序属性、 方法序列, 对AST进行相似度计算, 最终判定是否抄袭, 生成相似度检测报告。实验结果表明, 该方法能有效检测Java程序代码的多种抄袭行为。  相似文献   

8.
使用软件工具自动识别UML(Unified Modeling Language)模型中包含的设计模式,可以帮助软件开发人员理解、维护和重构大型软件项目.现有设计模式识别方法大多是将所考虑的若干个特征分别进行匹配,准确率和时间性能不高.为此,提出了一种基于相似度评分的设计模式识别方法.首先,给出该方法的基本流程;然后,提出一种基于有向图/矩阵的设计模式和系统的表示;接着,详细讨论了基于相似度评分的模式实例搜索算法;最后,实现了该方法的支撑工具,并使用该工具对一个开源项目进行了设计模式的识别.该方法不是将所考虑的若干个特征分别进行匹配,而是使用总特征矩阵进行匹配.实验结果表明,相对于将所考虑的若干个特征分别进行匹配的方法,该方法的识别准确率和时间性能更高.  相似文献   

9.
针对恶意代码在网络空间中呈爆发式增长,但多数是已有代码变种的情况。通过研究恶意代码行为特征,提出一套新的判别恶意代码同源性的方法.从恶意代码行为入手,提取恶意代码行为指纹,通过指纹匹配算法来分析恶意样本是否是已知样本的变种.经研究分析,最终筛选3种特征来描绘恶意软件的动态行为指纹:一是字符串的命名特征;二是注册表的变化特征;三是围绕关键API函数的调用顺序的特征.通过指纹匹配算法计算不同恶意代码之间的相似性度量,进行同源性分析.实验结果表明,该方法能够有效地对不同恶意代码及其变种进行同源性分析.  相似文献   

10.
王健  魏衍君 《科技信息》2013,(20):291-292
传统的木马检测技术在检测正确率、误报率和漏报率上都有不足,本文针对传统阴性选择算法在检测效率上的不足,提出一种基于并行计算的多特征区域匹配算法。这个算法首先把随机字符串分为多个特征区域,每个特征区域内对应一个检测器集合进行匹配,而特征区域之间采用r连续位匹配方式再次匹配,同时采用并行计算,设置匹配阈值进行匹配确认。实验证明改进的阴性选择算法在匹配位数和随机字符串位数增加时,候选检测器增加速度较平缓,系统负担增加较缓慢,因此具有较好的检测效率。  相似文献   

11.
针对代码抄袭及软件盗版现象, 研究了3种传统基于程序结构相似性检测方法, 并提出一种基于语法树的程序相似度检测方法。该方法先对源程序进行语法分析得到其语法树, 然后基于语法树重点分析源程序的语法结构并计算其相似度, 从语法结构的角度消除高级抄袭手段所带来的干扰。实验结果表明, 基于语法树的程序相似度检测方法可以较好地检测增加冗余语句、 控制结构的等价替换等10种抄袭手段。  相似文献   

12.
基于特征的图像匹配算法被广泛应用于图像处理和模式识别领域中,图像特征提取以及采用的匹配算法并直接决定图像匹配的效果。为了尽可能准确的实现图像匹配,提出了一种基于链码向量的边缘特征匹配算法。首先通过改进的Laplace边缘检测算子提取图像中的边缘信息,提高了边缘检测的可靠性;然后,将提取到的边缘信息由边界链码描述,并将边界链码构造成向量,利用数学向量相似度原则进行图像匹配。实验结果表明,该匹配算法简单快速,匹配准确率高,具有较高的实用价值。  相似文献   

13.
针对以前的保持前缀地址随机化算法或是性能不高,或是不能进行一致的随机化的问题,该文提出了一种基于随机字符串的保持前缀地址随机化算法。该算法使用预先得到的随机字符串,避免了计算的开销,加快了地址随机化的速度。使用基于随机字符串算法和C rypto-pan的混合算法,可以进一步避免大的内存开销。实验结果表明,对相同的需要随机化的地址数,基于随机字符串的算法使用的时间只相当于C rypto-pan的1/10。采用二者的混合算法,一般使用的时间相当于C rypto-pan的1/4,而所使用的内存要比基于随机字符串所使用内存少得多,因此能够实现更好的时间、空间折衷。  相似文献   

14.
为了克服当前图像匹配方法主要通过测量距离的方法来实现图像匹配,忽略了图像间的相似度,导致算法存在错误匹配较多以及鲁棒性较差的问题。本文提出了基于相似度模型耦合角度制约规则的图像匹配算法。采用FAST检测方法对图像特征进行检测,快速获取鲁棒特征点,以改善算法的匹配正确率。随后,利用SURF特征描述机制,通过计算特征圆域内的Haar小波响应值,对特征点进行描述。引入结构相似度SSIM(structural similarity index measurement)模型,将其与欧氏距离模型相结合,构造相似度模型,从结构相似度与测量距离两方面出发,将特征点进行粗匹配。最后,利用特征点的余弦关系,求取特征点间角度,建立角度制约规则,对粗匹配结果完成优化。实验结果显示:与典型的匹配方法相比,该算法具有更好的匹配性能较好,在多种几何变换下仍具有理想的匹配精度。  相似文献   

15.
陆军  方莹  张鑫 《北京理工大学学报》2015,35(12):1274-1279
针对传统动态规划立体匹配算法具有速度快的优点,但常伴随条纹现象的问题,设计了一种AD(absolute difference)与Census变换相融合的相似性测度算法,结合新的线性平滑项和动态变搜索半径的方法有效避免了上述问题,提高了匹配的速度和准确性.遮挡现象在双目视觉中难以避免,针对这一难题,采用左右一致性的遮挡检测算法对遮挡区域进行遮挡检测,设计了一种基于颜色和距离相似性的视差优化插值算法,改善了遮挡区域的视差估计.实验结果表明,该立体匹配算法能够快速、准确地估计出视差值,满足立体重构的需要.   相似文献   

16.
提出了一种基于KMP的模式匹配算法,给出了具体的实现方法。在不丢失匹配项的前提下,增大next函数的值,使得模式串向右尽可能得滑动更远的一段距离,忽略不必要的比较。通过实验证明,该方法与传统的方法相比能有效地加快匹配的速度,提高入侵检测的效率。  相似文献   

17.
基于AST的克隆序列与克隆类识别   总被引:2,自引:0,他引:2  
为了减少代码冗余,改善程序结构,提出一种新的基于抽象语法的代码克隆识别方法,归纳出常见的代码克隆形式并给出相应的重构技术.用二叉树表示源程序的抽象语法(BAST),逐条判断各语句BAST子树的同构性,识别出相似的语句序列作为克隆序列;根据子树同构识别一元克隆类,然后通过克隆类的连接操作,逐步识别二元及任意元数的克隆类.实验分析了多个开源软件,识别出了其中的克隆序列以及克隆类,从中归纳出4种常见的代码克隆,其基本特征分别为:相同的程序点访问同类对象的不同属性、部分变量名不同、针对不同的数据类型实施相同的操作、修改克隆区域外定义的变量,并对这4种代码有效地实施了重构.  相似文献   

18.
针对无限制手写体数字字符的识别问题进行了探讨.输入图像经过预处理后。进行特征抽取及分域处理.每一区域内对应一类基元、基元的类别由特征组合情况来确定.对骨架的拓扑结构进行全面描述.形成输入字符图像的一维链码.以此与参照链相匹配.根据匹配结果。进行识别.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号