首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 73 毫秒
1.
米文博  李勇  陈囿任 《科学技术与工程》2022,22(32):14275-14281
通过软件缺陷预测可以有效地提高软件测试效率,保证软件产品的质量。针对新开发的项目面临训练数据不足,标注代价高以及源项目与目标项目的缺陷模式难以匹配的问题,提出了基于主动学习的跨项目软件缺陷预测方法。首先使用主动学习方法对目标项目进行筛选标注,其次将得到的标签集与跨项目数据进行数据融合和模式匹配,最后构建跨项目软件缺陷预测模型。采用真实的软件缺陷数据进行实验,在保证预测率的前提下,曲线下面积(area under curve, AUC)能够达到0.692,与传统方法相比综合性能均有显著提升。结果表明:所提方法可以通过模式匹配有效提高跨项目软件缺陷预测模型的性能。  相似文献   

2.
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F1指标提升了18.33%;在LLTC4J数据集上,F1指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。  相似文献   

3.
针对传统的软件缺陷预测方法难以在单独的项目中利用小规模训练数据的问题,提出了一种基于迁移学习的软件缺陷预测技术,利用已有的项目辅助新项目的预测.该方法在源项目和目标项目之间寻找一个公共特征空间,使得在公共特征空间上2个项目的数据分布距离最小.在这个公共空间进行模型训练,以达到迁移分类的效果.实验结果显示该方法相对传统的缺陷预测算法有更好的预测性能,并且充分利用了原始训练数据,可以更高效地运用于各种软件缺陷预测任务.  相似文献   

4.
针对当前软件缺陷序列预测算法准确度不高的问题,提出了基于非线性加权的集成学习软件缺陷序列预测算法(NLWEPrediction)。该算法在常见线性集成预测算法的基础上增加了非线性回归项,回归项代表了集成预测算法中基预测算法之间的相互关系,修正了线性集成预测的偏差,并通过梯度下降法求解了模型中的参数。实验表明:NLWEPrediction在14个软件缺陷数据集上的均方误差均小于250,并且平均绝对误差均小于13。通过与基预测算法、集成预测Bagging、Stacking算法和只考虑两个分类器关系的非线性加权集成学习算法进行对比,可以看出,NLWEPrediction预测算法的均方误差和平均绝对误差显著减小,预测精度显著提高,说明在线性集成预测算法基础上增加非线性回归项,能够有效提高集成学习算法的分类效果。  相似文献   

5.
软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.  相似文献   

6.
为了避免在变量多重情况下基于PCA的软件缺陷预测出现明显失误,对传统PCA方法的缺陷加以改进,利用UML软件工程组织网站上公布的某中等规模软件公司项目功能点数据,采用改进的PCA方法对项目综合性能进行软件缺陷预测,并与传统PCA方法的预测结果进行了对比.结果表明,改进的PCA方法对软件系统的综合性能有较好的预测能力.  相似文献   

7.
8.
针对谱聚类算法中K-means处理无标识软件度量元数据易陷入局部最优的问题, 提出一种新的混沌免疫聚类算法. 该方法在免疫克隆选择算法的框架下, 设计抗体亲和度计算方法用于免疫克隆聚类中心的评价, 并给出分层混沌变异算子, 进一步提高了无标识软件度量元数据的预测性能. 仿真实验验证了算法的有效性.  相似文献   

9.
软件缺陷预测是软件开发过程中的一项重要技术,针对软件缺陷数据集的高维、小采样造成预测精度下降的问题,采用线性局部切空间排列算法对数据集降维处理,选用支持向量机作为基础分类器进行二值分类,建立软件缺陷预测模型,采用二维混淆矩阵评价模型的预测精度.实验结果表明,与其他模型相比,该模型可用较少的邻域点约简至更低的维度,不需要重新学习样本空间的流行几何结构,直接映射新的样本点,且预测时间耗费成本由13. 726 9 s降低至6. 217 s,给定参数区间寻优时间耗费由267. 442 1 s降低至165. 98 s,有效提高了软件缺陷预测的效率.  相似文献   

10.
高性能的软件缺陷预测模型可为软件自动化测试奠定重要的基础.当前的软件缺陷预测模型主要采用机器学习分类算法进行构建.其中,基于集成学习的软件缺陷预测模型通常可以达到当前最优的性能.然而,基于集成学习的软件缺陷预测模型的性能受到分类器的超参数取值的明显影响.因此,如何优化基分类器中的超参数,是提升基于集成学习的软件缺陷预测...  相似文献   

11.
研究考虑缺陷移除失败的软件缺陷预测改进模型,以提高缺陷预测能力.分析了传统Rayleigh模型的不足,在考虑缺陷移除失败因素的基础上,建立缺陷预测改进模型,并使用经验值及最大似然法估计获得模型参数.实例验证表明,改进模型可以有效地提高软件缺陷预测值与实际值的拟合度.  相似文献   

12.
探讨了传统BP神经网络的模型与结构,并针对BP神经网络容易陷入局部最优的缺陷,提出用模拟退火技术代替局部梯度下降法修正网络权值的SA-BP算法,用于构建SA-BP神经网络的软件缺陷预测模型,并通过实验证明了SA-BP神经网络模型应用于软件缺陷预测的有效性.  相似文献   

13.
塑性成形问题中一类表面缺陷的预测研究方法   总被引:5,自引:2,他引:5  
基于刚粘塑性有限元基本理论,本文深入地研讨了通过有限元数值模拟来预测塑性成形问题中一类表面缺陷生成的方法。提出了塑性有限元中的技术处理方法与表面缺陷测试算法,并采用该方法成功地预测了CONFORM连续挤压工艺中一种表面缺陷产生措施的全过程,给出一系列极限工艺参数,从而拓宽了刚粘塑性有限元的应用领域。  相似文献   

14.
基于软件大数据的自动化缺陷检测模型已成为缺陷发现的重要工具.针对软件大数据中,被准确标定的缺陷样本稀少,且漏标、误标率高,导致现有机器学习数据平衡优化方法易使噪声加剧、分类边界模糊等问题,提出一种稳健边界强化GMM-SMOTE软件缺陷检测方法.该方法利用高斯混合聚类将软件集合划分为多簇,基于簇内类别比进行可靠样本筛选并且通过后验概率实现边界识别,用以指导完成加权数据平衡,最后利用平衡优化数据构建软件缺陷检测模型.在NASA多个公开数据集上的实验结果表明,GMM-SMOTE可实现噪声抑制、边界强化的数据平衡,有效提高了软件缺陷识别效果,实际应用价值大.   相似文献   

15.
简单介绍了SVM的理论背景,详细介绍了基于SVM的分类预测方法。给出了基于SVM的分类预测技术的性能测试结果。指出该分类预测技术可将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性辨别函数来实现原空间中非线性辨别函数。  相似文献   

16.
针对由于传统的源代码缺陷分析技术依赖于分析人员的对安全问题的认识以及长期经验积累造成的缺陷检测误报率、漏报率较高的问题,提出了一种深度学习算法源代码缺陷检测方法.该方法根据深度学习算法,利用程序源代码的抽象语法树、数据流特征,通过训练源代码缺陷分类器完成源代码缺陷检测工作.其依据的关键理论是应用深度学习算法及自然语言处理中的词嵌套算法学习源代码抽象语法树和数据流中蕴含的深层次语义特征和语法特征,提出了应用于源代码缺陷检测的深度学习一般框架.使用公开数据集SARD对提出的方法进行验证,研究结果表明该方法在代码缺陷检测的准确率、召回率、误报率和漏报率方面均优于现有的检测方法.   相似文献   

17.
为解决缺陷预测中的缺陷分类问题, 提出了分层式缺陷预测模型。通过对缺陷特征的分析建立了缺陷特征预测方法, 使具有相似特征的缺陷形成相似特征缺陷簇。给出了相似特征缺陷簇间关联关系预测方法, 构建了缺陷关联关系预测模型, 使具有强关联关系的相似特征缺陷簇再次成簇, 从而达到缺陷预测的目的。实验结果表明, 在缺陷成簇密度、 成簇数量及成簇客观性方面, 该系统结构缺陷分层预测方法好于K-means算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号