首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
杜娟 《科学技术与工程》2011,11(12):2680-2685
传统的K-最邻近(K Nearest Neighbor,KNN)分类算法在处理不均衡样本数据时,其分类器预测倾向于多数类,少数类分类误差大。针对此问题从数据层的角度改进了传统的KNN算法。先通过K-means聚类算法将少数类样本聚类分组,将每个聚类内的样本作为遗传算法的初始种群;再使用遗传交叉和变异操作获取新样本,并进行有效性验证。最终获取到各类别样本数量基本均衡的训练样本集合。实验结果表明此方法有效改善了KNN算法对少数类分类效果。此法同时适用于其他关注少数类分类精度的不均衡数据集分类问题。  相似文献   

2.
为了提高忠诚度预测的准确度和效率,该文将K最近邻(K nearest neighbor,KNN)算法和贝叶斯算法相结合作为分类预测策略,提出一种基于改进最近邻算法的忠诚度预测方法。该方法先将高忠诚客户和低忠诚客户当作同一忠诚度类别,即同属于忠诚客户类别,利用贝叶斯算法对数据集进行初步分类,获得非忠诚客户和忠诚客户,再将忠诚客户作为下一步KNN算法的测试数据,对其做进一步分类,得到高忠诚客户、低忠诚客户和非忠诚客户。实验结果表明,该方法不仅能够降低K值即选择多少个邻居对最近邻算法的影响,减少其内存开销,而且能够有效缩短忠诚度分类的时间以及提高忠诚度分类的准确度。  相似文献   

3.
针对现有KNN算法识别率低的问题,提出了一种并行权重自适应k-邻域算法。该方法首先结合多线程技术,并采用分类组合的多个KNN单元进行识别以提高执行效率;其次在分类组合KNN算法中采用深度学习模型对各个类别进行了系数权重自适应设定,进而降低传统KNN和分类组合KNN,由于单纯类别个数的多少进行决策或者通过人为设定类别比例进行决策而引起的分类误差。通过在Fashion MNIST手写数据集进行实验,结果表明:该算法将传统的KNN算法分类正确率提高到97%左右,对实际应用具有一定的价值。  相似文献   

4.
提出了一种粗粒度并行遗传算法,并将其应用于被动控制结构中阻尼器布置位置的优化.该算法把一个种群划分为多个子种群,各个子种群可以独立完成经典遗传算法操作.对于给定基因编码的种群个体,通过Matlab-ABAQUS-Python的交互使用,利用Matlab编程生成INP模型文件,并先调用ABAQUS来进行模型分析,后调用Python来读取结果数据并传输给Matlab,求解结构模型的目标函数值.文中还以层间位移角为控制目标,对10层被动控制钢框架结构的阻尼器优化布置进行了实例分析.结果表明:粗粒度并行遗传算法与经典遗传算法相比,既提高了种群的多样性,又加快了种群的收敛速度;对比常规隔层方法,采用该算法可使结构减震率至少提高19. 3%,说明该算法能显著提高结构减震率.  相似文献   

5.
给出粗粒度并行遗传算法对于子种群间迁移策略的一种改进,即每隔一定的进化代数,各子种群与公共池交换最佳个体和代表个体.改进后的迁移算子淡化了子种群间交换个体时的拓扑结构,提高了各子种群的多样性.对复杂非线性函数求极值的仿真结果表明,改进迁移算子后的粗粒度并行遗传算法相对于固定拓扑结构的粗粒度并行遗传算法,得到最优解的进化代数提前,并且最优解的质量有所提高.  相似文献   

6.
针对遗传算法中的早收敛现象,从增强和保持种群多样性出发,引入自适应并行遗传算子的进化策略,提出了一种十进制自适应并行遗传算法(Decimal Adaptive Parallel Genetic Algorithm).实验结果表明,该算法对多个标准测试函数都表现出较好的搜索性能.  相似文献   

7.
【目的】针对K最近邻(K-Nearest Neighbor,KNN)算法中k值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k值。【方法】引入k的可信度的概念,提出一种基于局部密度和纯度的自适应选取k值的方法,并将其引入到传统的KNN分类算法中。【结果】该算法合理的考虑了样本的局部密度、纯度与选取k值的关系,不仅解决了k值的选取问题,并且避免了固定k值对分类的影响。【结论】该算法是有效的,可以得到较高的准确率,但算法的时效性有待提高。  相似文献   

8.
数据挖掘中分类问题一直是数据挖掘领域中研究的热点问题,先后提出了各种分类算法;其中遗传算法被认为是一种高效的分类算法.但是,传统的GA存在着易于陷入局部最优,致使得到的分类规则概括性不强的问题.提出了一种基于非随机初始种群的遗传算法分类规则挖掘算法.算法利用均匀种群方法生成非随机的初始种群,并通过均匀算子确保连续迭代过程中种群的多样性,从而达到防止GA早熟的目的.采用两个标准的公共领域的数据集验证了算法的有效性.实验结果表明,该算法能消除遗传算法在分类挖掘任务中收敛于局部最优的局限性,且能快速挖掘出易于理解的分类规则,提高对知识的理解力.  相似文献   

9.
针对面部识别问题提出了基于 QR 分解的模糊线性判别分析方法,并通过 ORL、Yale 和 FERET 人脸数据实验研究了该方法在不同距离下对面部识别率的影响;同时还研究了 KNN 分类器中 K 值的选择对面部识别率的影响.实验结果表明,距离的选取对面部识别率的结果有明显的影响.对不同的人脸数据集来说, KNN 分类器中的 K 的选取也会对识别率有影响.对于 ORL 面部图像数据来说,在 Minkowski 距离下(m=3), K=1时分类效果最好;对于 YALE 人脸数据,在 Chebyshey 距离下, K=5时分类效果最好;对于 FERET 人脸数据,在绝对距离下, K=1时分类效果最好.  相似文献   

10.
一种采用"部落通婚"策略的遗传算法   总被引:2,自引:0,他引:2  
受古代"部落通婚"现象启发,提出了一种新的多种群遗传算法的种群间迁移策略,并以此构造了一种采用"部落通婚"策略的遗传算法.为了验证该算法的有效性,考察了分类BP网络的训练问题和典型测试函数的优化问题.模拟结果表明,这种改进的遗传算法能有效地避免"早熟"现象,其收敛精度和收敛速度比标准遗传算法和通常的多种群遗传算法有一定程度的提高.  相似文献   

11.
K-最近邻的改进及其在文本分类中的应用   总被引:4,自引:0,他引:4  
采用K近邻算法(Knearest neighbors,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.  相似文献   

12.
阐述了注入式攻击及KNN算法的相关概念并探讨了注入式攻击行为检测与文本分类技术的关系.结合KNN算法的优点及注入式攻击行为检测与文本分类的相似性,提出了Web日志中基于KNN算法的注入式攻击检测方法,给出了其计算模型,并进行了检测对此.结果表明,该方法具有良好的检测准确度.  相似文献   

13.
提出了超长方体与KNN相结合的分类算法.在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本.在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别.实验采用四个真实数据集进行测试.实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法.  相似文献   

14.
林泳昌  朱晓姝 《广西科学》2020,27(3):276-283
针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练集均衡化,并训练逻辑回归模型;然后使用逻辑回归模型对训练集进行预测,获取预测为正样本的数据,通过使用SMOTE方法均衡化该正样本,并训练KNN模型;最后把测试集放入该结合逻辑回归方法的KNN模型进行预测,得到最终的预测结果。围绕6个不均衡数据集,将KSID与逻辑回归、KNN和支持向量机(SVM)决策树等方法进行对比实验,结果表明,KSID方法在准确率、查全率、查准率、F1值这4个性能指标上均优于其他3种方法。通过引入SMOTE,KSID方法克服了KNN模型遇到样本不均衡数据集时,产生分类偏向的问题,为进一步研究KNN方法的优化和应用提供参考。  相似文献   

15.
针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(k-nearest neighbor algorithm,KNN)个性化邮件过滤方法.该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终...  相似文献   

16.
针对K近邻方法分类准确率较高的特性,提出了一种基于相似度判据的K近邻分类器车牌字符识别方法.通过大量实验,选取字符的网格特征和轮廓特征作为分类依据,用特征融合方法将两种特征合并,实现特征的串行融合.根据相似度判据作K近邻分类,实现了一个车牌字符识别系统.实验表明,这种方法具有良好的识别效果,鲁棒性强,具有较大的实用价值.  相似文献   

17.
传统的K最近邻算法(KNN)算法可以解决话务分析专家系统中的求解问题,但KNN算法的不足在于K值的确定与执行效率,因此改进K值选取与加权方法,对提高算法运行效率与准确性具有重要意义.本文提出了一种改进K值选取方法及依托频率的权重计算方法,用于实例检索,并采用改进后的实例推理,构建了话务故障专家系统.实验结果表明,改进算法在实例匹配准确性与执行效度上,均优于传统方法.  相似文献   

18.
针对文本分类存在的高维文本问题,提出文档频率(DF)-卡方统计量特征提取方式,对特征项进行有效约减,降低文本维度,提高分类精度.在K最近邻(KNN)算法的基础上,针对待分类文本需要和大量训练集样本进行相似度计算的问题,提出一种基于分组中心向量的KNN算法,对类别内的样本集分组求出各组中心向量,使其重新代表训练库计算相似度,降低计算复杂度,提升算法的分类性能.通过实验表明:相较传统KNN算法,改进的算法在准确率、召回率及F值方面都有提升,与其他分类算法相比,具有一定的优势.  相似文献   

19.
在线社交网络中用户伪装攻击检测方法研究   总被引:1,自引:0,他引:1  
当前用户伪装攻击检测方法无法适应动态环境,实时性不高;且需要准确的先验知识,检测精度较低。提出一种新的在线社交网络中用户伪装攻击检测方法,介绍了k最邻近节点(KNN)算法的基本思想,给出KNN算法的实现过程。分析了用户伪装攻击检测与分类的关系,确定在线社交网络中用户伪装攻击检测就是对被检测的未知行为进行分类的过程。针对用户行为,将训练集中正常用户行为的邻居进行排列,通过和k相似的邻居的分类标签对新用户行为类别进行判断,从而实现用户伪装攻击检测。实验结果表明,所提方法不仅检测精度高,而且开销小。  相似文献   

20.
分析了分段对文本分类的影响,提出了与文本语义密切相关的最大语义标志原则(MSMR)和段落间的语义激励原则(SIR),在模糊K-最近邻分类算法的基础上,应用这2个原则设计并实现了一种基于上下文的文本片断模糊分类算法.该算法依据SIR判断文本片段分类的相互影响,降低了片段分类的错误率,当某一片断类隶属度大于某一阈值时,依据MSMR判定可知,同一文档的后续片断均属于同一类别,这样就不用计算所有片断的类隶属度.实验表明:与模糊K-最近邻分类算法相比,所提算法能有效提高系统的查准率、查全率和正确率,其中查全率可提高16%以上;在同一会话中,由于被明确分类后的后续片段不需要计算类隶属度,所以算法总计算时间明显少于模糊K-最近邻分类算法,具有较高的分类效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号