结合相似度的朴素贝叶斯半监督自训练方法 |
| |
引用本文: | 马茂源,吕佳.结合相似度的朴素贝叶斯半监督自训练方法[J].重庆师范大学学报(自然科学版),2019,36(1):78-84. |
| |
作者姓名: | 马茂源 吕佳 |
| |
作者单位: | 重庆师范大学计算机与信息科学学院,重庆,401331;重庆师范大学计算机与信息科学学院,重庆401331;重庆师范大学数字农业服务工程技术研究中心,重庆401331 |
| |
基金项目: | 重庆市自然科学基金;人文社会科学研究项目;重庆市教委科技项目;重庆师范大学科研项目 |
| |
摘 要: | 【目的】自训练方法易选出低置信度的无标记样本去训练分类器,在训练中也易误标记无标记样本导致错误累积,针对这些问题提出结合相似度选择高置信度样本的朴素贝叶斯自训练方法。【方法】选择朴素贝叶斯作为基分类器,在迭代中通过相似度计算方法计算样本相似度,选择同时满足相似度阈值和类别号判别一致的无标记样本加入训练集。【结果】在UCI数据集的对比实验中发现,提出的新方法的分类正确率高于其他对比算法。【结论】新方法能够利用少量有标记样本和不断添加的置信度高的无标记样本去训练分类器,提高分类精度,解决了自训练方法因有标记样本集初始分布不均导致准确率较低的问题。
|
关 键 词: | 自训练 半监督 朴素贝叶斯 欧氏距离 余弦相似度 |
Naive Bayes Semi Supervised Self Training Method Combine with Similarity
|
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《重庆师范大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《重庆师范大学学报(自然科学版)》下载免费的PDF全文 |
|