首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
针对传统基于抽象语法树的代码抄袭检测方法中存在的检测准确率不高及无法检测语义层面抄袭的问题,设计了一种基于改进抽象语法树的代码抄袭检测方法,该方法通过TF-IDF加权简化的语法树提高检测准确率.利用加权简化的抽象语法树设计特征提取和相似度计算方法实现对语义抄袭的部分检测,实验结果表明,该改进方法比传统的基于抽象语法树的检测方法的准确率更高,且能有效检测出部分基于语义层面的代码抄袭.  相似文献   

2.
Android应用程序中存在大量的代码异味,现有的Android代码异味检测工具效率较低.为此,将抽象语法树(AST)进行分层,提出一种基于分层AST的Android异味检测方法 .实例研究表明,与其他方法相比,该方法能检测出更多类型的Android代码异味.  相似文献   

3.
为了缩短软件工程生命周期,引入组件、复制的概念,利用抽象语法树(AST)将相同功能的代码设计为一个函数,保留充足的接口参数,利用过程调用开发软件程序,可以提高软件开发效率.  相似文献   

4.
软件测试是排除软件故障,提高软件质量和可靠性的重要手段。从是否需要执行被测程序角度考虑,软件测试分为静态测试和动态测试。动态测试通过输入测试数据,动态执行程序来发现软件中存在的错误。尽管动态测试能发现部分软件错误,但对于一些特殊类型错误的检测无效。鉴于此,本文采取了一种特殊的静态分析技术来实现对代码的测试。本文首先讨论了传统软件测试方法的缺点和局限性,给出了软件的故障模型,进而提出了基于抽象语法树的静态分析技术,并给出了故障自动检测算法。依据该算法开发了自动化测试工具,给出了实验结果和对比分析,并指出了下一步的研究方向。  相似文献   

5.
基于抽象语法树的代码静态自动测试方法研究   总被引:1,自引:0,他引:1  
软件测试是排除软件故障,提高软件质量和可靠性的重要手段。从是否需要执行被测程序角度考虑,软件测试分为静态测试和动态测试。动态测试通过输入测试数据,动态执行程序来发现软件中存在的错误。尽管动态测试能发现部分软件错误,但对于一些特殊类型错误的检测无效。鉴于此,本文采取了一种特殊的静态分析技术来实现对代码的测试。本文首先讨论了传统软件测试方法的缺点和局限性,给出了软件的故障模型,进而提出了基于抽象语法树的静态分析技术,并给出了故障自动检测算法。依据该算法开发了自动化测试工具,给出了实验结果和对比分析,并指出了下一步的研究方向。  相似文献   

6.
目前的源代码漏洞检测方法大多仅依靠单一特征进行检测,表征的维度单一导致方法效率低.针对上述问题提出一种基于结构化文本及代码度量的漏洞检测方法,在函数级粒度进行漏洞检测.利用源代码结构化文本信息及代码度量结果作为特征,通过构造基于自注意力机制的神经网络捕获结构化文本信息中的长期依赖关系,以拟合结构化文本和漏洞存在之间的联系并转化为漏洞存在的概率.采用深度神经网络对代码度量的结果进行特征学习以拟合代码度量值与漏洞存在的关系,并将其拟合的结果转化为漏洞存在的概率.采用支持向量机对由上述两种表征方式获得的漏洞存在概率做进一步的决策分类并获得漏洞检测的最终结果.为验证该方法的漏洞检测性能,针对存在不同类型漏洞的11种源代码样本进行漏洞检测实验,该方法对每种漏洞的平均检测准确率为97.96%,与现有基于单一表征的漏洞检测方法相比,该方法的检测准确率提高了4.89%~12.21%,同时,该方法的漏报率和误报率均保持在10%以内.  相似文献   

7.
针对漏洞检测领域面临的实验平台不统一、数据集异构等问题,研究词向量模型在C/C++函数漏洞检测方面的应用.用5种词向量模型对源代码生成的抽象语法树结构进行知识表示,用6种神经网络模型进行漏洞检测,实验结果表明,函数级代码具有浅层的语义关系,代码块内部联系紧密.  相似文献   

8.
无论在商业软件还是在学生程序设计作业中,程序代码的抄袭都是一种普遍存在的现象。对程序代码进行复制检测是一个复杂的计算过程。探讨了源代码复制检测技术的现状,提出了对学生程序设计作业进行源代码复制检测的一种实现方案。  相似文献   

9.
源代码作者身份识别有助于解决恶意代码攻击溯源、代码剽窃、软件侵权等问题,本文提出一种新的基于图匹配网络和抽象语法树的源代码作者身份识别方法.首先,通过删除注释、统一换行符、制表符预处理源代码,消除不同集成开发环境和代码布局的影响;然后,基于数据增强抽象语法树将源代码转换为树结构,添加不同类型的边构建代码特征图,不仅关注语法和句法特征,还提取了代码中数据流和控制流特征;接着使用特征图训练图匹配神经网络,生成源代码的图嵌入特征向量;最后,使用孪生神经网络对输出的两个图嵌入特征向量进行计算,识别源代码作者身份.实验结果表明,本文的方法在包含1000位程序员的Google Code Jam数据集上达到了95.60%的准确率,与现有的源代码作者身份识别方法相比,提高了准确率和扩展性.  相似文献   

10.
提出了一种消除抽象语法树文本中冗余的方法,借助Knuth-Morris-Pratt(KMP)算法,设计核心算法,对抽象语法树进行简化,并选出几个经典的代码片段进行实验,对算法的性能做了相应验证.实验结果表明,算法在消除冗余方面的简化率达到90%以上.  相似文献   

11.
在现代汉语教学和研究中,为了分析句子成分之间的关系,经常需要绘制句法结构图.手工方式绘制具有工作量大,存储容量大等缺陷.针对该问题研究了采用VML技术进行句法结构树自动生成以及句法结构树在网页中可视化的方法.与北大树库中的树图进行比较的结果表明提出的图形元素定位方法更精确.  相似文献   

12.
针对代码抄袭及软件盗版现象, 研究了3种传统基于程序结构相似性检测方法, 并提出一种基于语法树的程序相似度检测方法。该方法先对源程序进行语法分析得到其语法树, 然后基于语法树重点分析源程序的语法结构并计算其相似度, 从语法结构的角度消除高级抄袭手段所带来的干扰。实验结果表明, 基于语法树的程序相似度检测方法可以较好地检测增加冗余语句、 控制结构的等价替换等10种抄袭手段。  相似文献   

13.
基于Java语言的抽象语法树的创建与遍历   总被引:3,自引:0,他引:3  
廖兴  尹俊文  蔡放 《长沙大学学报》2004,18(4):50-53,57
抽象语法树(Abstract Syntax Tree ,AST)作为程序的一种中间表示形式,在程序分析等诸多领域有广泛的应用.利用抽象语法树可以方便地实现多种源程序处理工具,比如源程序浏览器、智能编辑器、语言翻译器等.本文作者介绍了抽象语法树涉及的原理及解释器的设计方案,针对Java语言,利用设计模式理论提出了创建和遍历抽象语法树的思路,并给出较为详细的代码说明.  相似文献   

14.
提出了一种新型的高性能的级联码.该码的内码采用递归系统卷积码,外码采用Tailbiting码.另给出了该编码的迭代解码算法,并通过计算机仿真,将其和普通的串行级联码在性能上进行了比较。  相似文献   

15.
基于PCA和决策树模型的农用地(耕地)质量评价研究   总被引:1,自引:0,他引:1  
主要利用ArcGIS、PCA和See 5决策树模型,以原始数据为基础,对福建省将乐县农用地(耕地)质量进行评价.首先根据将乐县的自然、社会和经济等各方面情况,初选排溉条件等9个主要指标作为评价因子;然后用ArcGIS矢量化提取相关图层并进行相应的空间分析,经过多图层叠加确定评价单元及其属性数据;再利用PCA方法最后确定耕地质量评价综合因子;接着利用数据挖掘工具See 5,自动构建决策树模型,进而用构建的模型来获取耕地质量分等规则的方法;最后划分耕地质量级别,并进行抽样检验结果的准确性.研究结果表明:该县耕地质量中等,一至四等地分别占22%,44%,15%,19%,经实地检验评价结果基本与实际情况相符.  相似文献   

16.
可达性是城市公共服务设施选址布局领域必须考虑的重要因素。本文依据枞阳县消防站布点及路网数据等信息,结合空间句法和缓冲区分析法对城市消防站的全局可达性和局部可达性进行定量测度,揭示了不同时期研究区道路网络的可达性分布的空间形态特征和演变情况,为枞阳县消防站的选址布局及优化提供数据支撑。结果表明:1)研究区内规划道路的全局可达性较现状道路有很大提升,局部可达性有所提升;2)规划道路中的全局可达性较好但未达到1,各空间单元呈离散的模式,与规划的组团式布局相吻合,规划道路中局部整合度和全局整合度较高的路段存在错位现象;3)现有消防站的全局和局部可达性综合表现良好,可成为区域范围内消防力量有效调配的支持基础;4)除现状以外的其他消防站全局、局部可达性均不是很高,尤其是外围组团的消防站与局部可达性较高的路段有明显的“错位”现象。  相似文献   

17.
采用图形分析法分析了1980年以来上海市南京西路片区各个街区城市肌理和城市空间特征值的演变.基于空间句法理论对街区空间拓扑参数进行了定量计算,并结合城市空间特征值对片区空间形态进行了综合定量评估.结果表明:以商业化为主导的大城市中心城区更新运动使街区空间形态向肌理粗糙、街巷稀松、高强度和相对孤立特征演变,并且不同的更新程度对街区空间形态产生的影响不甚相同.最后,提出在城市中心区更新过程中应注意空间多样性建设和对城市传统文化和传统业态的保育.  相似文献   

18.
一种改进的基于数据库的树存储策略   总被引:2,自引:0,他引:2  
关系数据库管理系统的优势在于存储以二维数据表为模型的数据结构,而在科学研究领域中,一般树作为重要的数据模型广泛存在。本文讨论的中心问题是如何在数据库管理系统中存放压缩的一般树,并在维护海量数据的同时,降低数据冗余,最后讨论数据一致性的保证和对比分析存储、检索算法的时空复杂度。本文通过对树的压缩存储技术的研究,所产生的结论和方法可以延伸到解决众多非线性数据结构在数据库管理系统中的存储问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号