首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.  相似文献   

2.
一种基于KNN的半监督分类改进算法   总被引:1,自引:0,他引:1  
本文提出一种新的基于KNN分类的半监督学习self-training改进算法,并以多个UCI数据集为实验,对基于KNN的半监督分类模型算法进行改进,充分利用已知类别标签数据的正确知识进行自训练,以得到最终分类结果.实验结果表明,该方法能显著提高分类准确率.  相似文献   

3.
为解决数据分布式存储下实现较高精度和安全性的个性化推荐,提出了一种全新的分布式半监督推荐系统框架。尝试将半监督学习方法中的协同训练(Co-training)与基于深度学习的深度协同过滤模型结合为Co-NCF模型,并使用基于consensus算法的分布式梯度下降法来训练Co-NCF模型,以此构建了Co-NCF模型的分布式版本。该模型在MovieLens数据集上的测试中,表现显著强于现有的分布式NCF模型。  相似文献   

4.
针对基于监督学习的SQL注入检测方法在某些场景下不适用的问题,本文提出一种基于自训练的半监督SQL注入检测方法(self-training based semi-supervised SQL inj ection detection,S4ID).S4ID首先对SQL语句进行特征提取,包括基于语法树的模式提取和基于词袋模...  相似文献   

5.
【目的】针对在标准协同训练中不具有充分冗余的视图分割,致使分类器错误累计过多,以及一对基分类器标记样本类别不一致的问题,提出了基尼指数结合K均值聚类的协同训练算法。【方法】该算法首先计算已标记样本中各特征的基尼指数,将该指数升序排列后均等划分到两个视图,然后在基分类器所标记的样本中,运用K均值聚类确定标记不一致样本的类别后加入标记样本。【结果】通过9个UCI数据集在3组实验上的结果表明,所提算法相较于对比算法提升了分类效果。【结论】运用基尼指数均等划分关键特征于两个视图,有利于改善视图分割不充分冗余的缺陷;K均值聚类法对分类不一致样本进行重新标记,降低了协同训练算法中的误标记率。  相似文献   

6.
通过分析传统基于概率度量的K邻近置信度评估方法,提出一种基于最大差距的置信度评估方法,并在UCI数据集上对两种方法进行对比实验.实验结果表明,基于最大差距的置信度评估方法在宏平均召回率、宏平均精度及所用时间上均优于K邻近置信度评估方法,从而可进一步优化半监督分类学习中数据样本的置信度评估.  相似文献   

7.
本文提出了基于流形正则协同训练模型的行为识别方法。该方法将拉普拉斯正则引入到协同训练模型中,利用大量未标记样本数据从不同视角数据上训练出两个分类器,两者之间互换未知信息并更新分类器,以提高识别精确度。在动作数据集UCF-iphone上进行了大量的实验验证算法的有效性,结果表明,引入拉普拉斯正则能有效地提高动作识别精确度。  相似文献   

8.
为了提高半监督分类的有效性,提出一种基于交叉验证思想的半监督分类方法(CV-S3VM)。通过对未标记样本进行伪标记,将伪标记后的样本加入到标记样本集中,参与交叉验证,选取能使SVM分类器误差最小的标记作为最终的标记,实现对未标记样本进行标记。依次挖掘未标记样本的隐含信息,增加标记样本的数目。使用UCI数据集模拟半监督分类实验环境,结果表明CV-S3VM具有较高的分类率,在标记样本较少的情况下效果更为明显。  相似文献   

9.
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度.  相似文献   

10.
随着经济的快速发展,信用贷款在企业资金周转中的作用越来越重要.信用评级是信用贷款发放的基本依据之一.本文针对实际信用评级中有标签样本数量不足的问题,提出一种基于Tri-training算法的多分类信用评级方法,该方法选择支持向量机、决策树和最大熵模型作为基分类器组合.最后,本文使用真实的信用数据集验证了该方法的实际效果.  相似文献   

11.
主动学习时向专家查询得到的标注如果带有噪声,将会影响学习的性能.为减少噪声,人们提出了基于“少数服从多数”的多专家主动学习算法,但该算法的缺点是代价往往太高.文章采用了一种自我训练(self-training)方法,对某些平均置信度高的样本,直接确定其分类标注,不必向专家查询,以节省学习代价.同时,使用置信度差异作为度量标准,选取那些最不确定的样本向专家查询,提高了学习效率.在UCI数据集上验证了本文算法的有效性.  相似文献   

12.
杨蕊  赵颖博 《科学技术与工程》2024,24(20):8541-8549
多雷达协同组网进行目标探测识别时,受复杂战场环境影响,获取的数据富含大量杂波和不确定信息,传统雷达点迹识别算法在处理此类数据时具有一定局限。为此,文章提出了基于自适应置信分类网络的雷达点迹识别算法。构建置信分类网络,获取各轮迭代下雷达点迹隶属目标、杂波和不确定的置信度。然后基于点迹的空间分布特性构造决策证据并进行修正融合。融合结果促使点迹类别更新,更新点迹则再次驱动置信分类网络训练学习。如此迭代优化,直至所有雷达点迹类别标签不再更新。实测雷达点迹验证实验显示,与传统典型雷达点迹识别算法相比,新算法可有效提升点迹识别正确率。此外对训练样本依赖较小,便于推广应用。  相似文献   

13.
在半监督学习训练的过程中,由于分类器对噪声的引入使得分类器性能下降而影响分类准确性,本文提出一种具有自我调节的二次伪迭代算法.该算法延用Tri-training算法的3个分类器思想,在一定条件下引入少量的人工作业,从而避免一些标记难分类而影响训练的进行,并且采用自我调节功能,用于减少在分类过程中出现的噪声数据和降低对分...  相似文献   

14.
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。  相似文献   

15.
针对不平衡分类问题的极端情况,即用于训练的样本极少甚至只有一个实例,该文提出了一种单实例分类算法,这种方法使用球面作为分类面,在目标类的单实例在球内和反类尽量位于球面外的约束条件下,最大化该分类球面的半径,该方法能够有效地处理线性可分的数据分布.当输入样本分布结构呈高度非线性时,该算法通过核映射将低维输入空间中的非线性可分问题变换为高维特征空间中可能的线性可分问题,并以内积形式刻画,最终在特征空间上通过核技巧获得原问题的解决.通过对标准数据集和实际数据集的实验,验证了单实例分类算法在处理数据不平衡问题上的有效性.  相似文献   

16.
在线评论广泛存在于电子商务网站平台, 其中包含着客户对产品的评价及偏好. 高效分析在线评论数据并满足客户需求, 对许多谋求立足于竞争激烈的国际化市场的企业来说至关重要. 但因在线评论的质量不一, 使得如何分析在线评论的质量成为一项重要工作. 从两个方面提取特征对在线评论进行描述, 并构建了一种Co-training算法来判断评论的质量. 通过对比实验验证了该算法相对于单一分类算法的优势.  相似文献   

17.
In communication alarm correlation analysis,traditional association rules generation(ARG) algorithm usually has low efficiency and high error rate.This paper proposes an alarm correlation rules generation algorithm based on the confidence covered value.Confidence covered value method can judge whether a rule is redundant or not scientific After the rules that based on weighted frequent patterns(WFPs) generated,the association rules were deleted by the confidence covered value,in order to delete the redundant rules and keep the rules with more information.Experiments show that the alarm correlation rules generation algorithm based on the confidence covered value has higher efficiency than the traditional method,and can effectively remove redundant rules.Thus it is very suitable for telecommunication alarm association rules processing.  相似文献   

18.
楚绪格  张永 《甘肃科技》2005,21(5):63-65
分类知识发现是数据挖掘的一项重要内容,研究各种高性能、高速度的分类算法是数据挖掘面临的主要问题之一。大多分类问题由于各特征之间存在交互性等不确定性问题。使得一般的神经网络分类算法难以取得好的分类效果。本文通过构造一种分层神经网络的分类方法。明显地提高了分类精度。  相似文献   

19.
提出一种基于粗糙集理论的决策树分类算法.首先,将核属性集中的核属性进行合取后加入析取变换,实现属性约简;其次,在决策树构造阶段,对各条件属性分别求其上下近似集,进而得到各属性的近似精度.选择近似精度最大的属性作为决策树的根结点,以此方法递归应用到各子树上来选择决策树的结点并实现决策树的剪枝.实例分析表明,改进的算法提高了决策树方法的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号