首页 | 本学科首页   官方微博 | 高级检索  
     

基于密度峰值聚类的Tri-training算法
作者姓名:罗宇航  吴润秀  崔志华  张翼英  何业慎  赵嘉
作者单位:1. 南昌工程学院信息工程学院;2. 太原科技大学计算机科学与技术学院;3. 天津科技大学人工智能学院;4. 深圳市国电科技通信有限公司
基金项目:国家自然科学基金(52069014);
摘    要:Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。

关 键 词:Tri-training  半监督学习  密度峰值聚类  空间结构  分类器
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号