首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种基于类数据流的软件测试技术   总被引:4,自引:0,他引:4  
提出了一种类数据流测试技术,通过类的数据流分析计算出实例变量的定义-使用对信息及成员函数的前置条件和后置条件,匹配函数的前置条件和后置条件为每一定义-使用对产生函数激活序列(即测试用例).这样产生的测试用例能够发现成员函数与实例变量之间交互作用时发生的错误,并且弥补了传统数据流测试技术的不足,减少了重复测试,提高了测试效率.  相似文献   

2.
Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-means算法等相关技术。最后,实现了该文本聚类系统,对采集到的Web文本进行聚类,实验证明此算法具有很好的聚类结果。  相似文献   

3.
一种基于本体的文本聚类方法   总被引:2,自引:0,他引:2  
基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性.  相似文献   

4.
针对传统K-means算法的聚类结果依赖初始聚类中心的缺陷,提出了一种基于密度的改进K-means聚类算法,该算法选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-means聚类。针对PAM算法时间复杂度高,且不利于大数据集处理的缺陷,提出了一种基于密度的改进K-medoids聚类算法,在选取初始中心点时根据数据集样本的分布特征选取,使得初始中心点位于不同类簇。UCI机器学习数据库数据集和随机生成的带有噪音点的人工模拟数据集的实验测试证明,基于密度的改进K-means算法和基于密度的改进Kmedoids算法都具有很好的聚类效果,运行时间短,收敛速度快,有抗噪性能。  相似文献   

5.
密度峰值聚类算法(density peaks cluster,DPC)是一种基于密度的聚类算法,该算法可以聚类任意形状的类簇.在类簇间有密度差距的数据集上,DPC不能准确地选择聚类中心.DPC的非中心点分配策略会引起连续错误,影响算法的聚类效果.模糊k近邻密度峰值算法(fuzzy k-nearest neighbor DPC,FKNN-DPC)是一种改进的DPC算法,该算法采用边界点检测并结合2步分配策略来避免连续错误.当类簇间有密度差距时,FKNN-DPC的边界点检测效果不理想,此外,其非中心点分配策略缺乏对样本近邻信息的考虑.定义相对密度(relative density)并结合近邻关系(nearest neighbor relationship)提出RN-DPC算法解决上述问题.针对DPC因为类簇间的密度差距而不能准确选择聚类中心的问题,定义相对密度用于消除类簇间的密度差距.基于反向k近邻关系检测边界点并且引入共享最近邻关系来对FKNN-DPC的分配策略进行改进.RN-DPC算法在人工数据集和真实数据集上分别与不同的聚类算法进行了对比,实验结果验证了RN-DPC算法的有效性和合理性.  相似文献   

6.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

7.
针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进行实验,实验结果表明,该改进算法能够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现.  相似文献   

8.
Web用户聚类研究   总被引:1,自引:0,他引:1  
Web日志数据的海量增长,要求聚类算法能高效的从海量数据中得到满意的用户聚类.本文提出了一种新的聚类算法,在聚类前,利用用户兴趣度对海量数据集进行约简、减小数据计算规模,然后再对Web用户进行聚类.实验证明这种方法能减小数据规模、提高聚类效率,并得到满意的用户聚类.  相似文献   

9.
针对类交互测试的正交阵列测试系统(OATS)生成测试用例的方法存在类的状态盲目组合而导致测试用例“爆炸”以及受标准正交阵列的影响使得选择的正交阵列不易扩充等问题,扩展了事件驱动的Petri网(EEDPN)模型,提出了类的状态组合的标记关联递推法生成交互路径,得到了扩展的正交阵列测试系统(EOATS)的类交互测试用例的生成方法,优化了OATS,分析了该方法在类的交互测试技术中的覆盖率问题,讨论了其生成扩展的正交阵列表的充分性。  相似文献   

10.
给出一种将网格技术、密度技术与分形理论的自相似性结合起来的一种有效聚类算法,利用分形维度变化最小同时是相似程度最大的特点来划分数据集从而得出聚类结果.实验表明该算法可以快速有效的处理多维大型数据集,识别出任意形状簇的个数,而且可以从数据集中挖掘出一些有用的分布信息.  相似文献   

11.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

12.
结合电力系统定时限保护整定计算的特点,提出了一种新的实用断点计算方法.定义了配合环网和死锁环网的概念,并通过预整定形成死锁环网;在所得死锁环网基础上,将依赖函数扩充分为主依赖函数和后备依赖函数,根据主/后备依赖函数中元素的特点判断死锁环网中是否存在特殊网络结构并进行相应的处理,同时动态地将主依赖函数或后备依赖函数为空的保护从待选断点保护中删除,以保证每一步的断点计算都是针对环网进行.算例表明:本方法能较好地满足国内电力系统定时限保护逐级配合整定计算的要求.  相似文献   

13.
本文分析了模板依赖分别和多值依赖、嵌入多值依赖、连接依赖之间的关系。在此基础上给出了后三种依赖均可表示成模板依赖的形式。  相似文献   

14.
A genetic algorithm to solve the set covering problem proposed in the literature had some improvements which gave better solutions, i.e., better chromosomes in the first starting population, taking full account of domain specific knowledge with sound programming skill. We have further investigated the input data dependency of their genetic algorithm, i.e., the dependency on costs and density. We have found that for input problem data sets with densities greater than or equal to 3%, our genetic algorithm is still practical both in computing time and approximation ratio.  相似文献   

15.
为了减少变量变更的代价,需要评估变量在程序中的重要程度。对变量的重要性度量有利于合理安排软件测试资源,保证软件质量。通过分析程序中各变量状态,利用变量间的依赖关系构建变量依赖关系模型,将图论和变量重要性度量相结合。针对现有节点重要性度量方法存在的局限性问题,提出一种新的基于变量依赖关系模型的变量重要性度量方法。实验表明,该方法在变量重要性度量方面的准确性相比其他方法有所提升。  相似文献   

16.
在对中国人口年龄结构、消费率与城乡消费差距现状分析的基础上,基于2000-2014年中国省级面板数据,综合时空尺度,建立动态面板及空间面板数据模型,探究人口年龄结构对城镇消费率、农村消费率及城乡消费差距的影响.结果显示,少儿抚养比与老年抚养比对城镇居民消费率均具有正向影响,而对农村地区居民消费率则分别产生负效应和正效应;城乡少儿抚养系数比、城乡老年抚养系数比对城乡消费差距均具有正效应,且城乡居民消费差距存在空间集聚格局,呈现正的空间依赖性;"全面两孩"生育政策将改善人口年龄结构,从而有利于缩小城乡消费差距.  相似文献   

17.
构造了一个求解最小函数依赖集Fmin的计算机算法.该算法将求解Fmin的逻辑推理过程包装在一个C 函数之中,通过运行与此函数相配套的程序,可以快速、准确地获得与所给函数依赖集F等价的Fmin从而使求解Fmin的过程方便、快捷.  相似文献   

18.
批处理依赖是一种特殊的函数依赖,但其定义的推理规则过于严格而不适用于含噪数据.为了从含噪数据中挖掘出有价值的批处理依赖,在批处理依赖研究的基础上,提出了近似批处理依赖的概念,并通过引入可信度、特异度等度量指标,提出了相应的近似批处理依赖挖掘算法;最后通过实例说明了算法过程及其有效性.  相似文献   

19.
多值依赖MVD保持性的研究   总被引:2,自引:0,他引:2  
基于数据依赖基于概念给出了保持多值依赖MVD集的定义,提出了构造联接树的算法,生成MVD集与保持MVD集的检验算法,同时对算法给出了证明。  相似文献   

20.
针对多环复杂电网方向保护整定计算中最小断点集的确定,提出了保护依赖度和主/后备保护依赖集的新概念.首先将有向简单回路的形成归结为环网中所有保护依赖度大小的比较和保护依赖集的深度搜寻过程,然后利用复杂环网方向保护最优整定配合中最小断点集(MBPS)的启发知识,最后将MBPS的计算等价为0-1整数二次规划问题.基于遗传优化计算原理,提出了MBPS问题的遗传计算方法.该方法能统一处理环网中的T接线、辐射线路等保护的配合问题.算例表明,该方法简单并且有效,大大降低了问题的计算复杂性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号