共查询到20条相似文献,搜索用时 625 毫秒
1.
半监督学习在入侵检测系统中的应用 总被引:1,自引:0,他引:1
提出了一种基于半监督模糊聚类的异常入侵检测方法,半监督学习算法的训练样本包括已标记数据和未标记数据,在训练系统模型时使用少量已标记样本和大量未标记样本作为种子初始化入侵检测系统的分类器,在少量已标记数据的约束下利用模糊C均值方法生成聚类,无需提供大量标记数据,不易陷入局部最优.实验表明,与FCM算法相比具有较高的性能. 相似文献
2.
《华中科技大学学报(自然科学版)》2021,49(7):92-96
提出了一种基于半监督卷积收缩自编码器的缺陷识别方法.从未标记数据中获取有效缺陷信息,结合少量标记样本,实现较高的缺陷识别效果,解决了传统的基于卷积神经网络的缺陷识别方法依赖大量标记样本的问题.实验结果表明:本文方法具有较高的识别精度,在少量标记样本下即可获得不错的识别效果,相较于其他方法,准确率提升4.93%~62.96%,可有效降低样本标记成本,加快模型部署速度,确保质量检测和生产计划顺利进行. 相似文献
3.
多数在线垃圾邮件识别方法未有效区分用户针对不同邮件内容的感兴趣程度,导致垃圾邮件识别精度不高.文中提出了一种基于支持向量机的垃圾邮件在线识别新方法.即结合传统增量学习及主动学习理论,先通过随机选择代表样本寻找分类最不确定的样本进行人工标注;接着引入用户兴趣度的概念,提出了新的样本标注模型和算法性能评价标准;最后结合"轮盘赌"方法将标注后样本加入训练样本集.多种对比实验表明,文中方法针对垃圾邮件识别精度高,样本训练及待标注样本选择速度快,具有较高的在线应用价值. 相似文献
4.
5.
近年来由于其表示的有效性,基于表示的分类方法,例如稀疏表示分类器(SRC)或者协同表示分类器(CRC)被广泛的应用于各种各样的识别任务.但是,SRC或者CRC的性能严重依赖于每类带标签训练样本的个数,当每类带标签的训练样本不够充分,SRC或者CRC的识别性能将会显著地下降.为了解决这个问题,文章[34]把协同表示技术引入到半监督学习方法中,提出了一种基于协同表示的标签传播算法,有效的利用了大量未标记样本的信息来进行标签传播.受此启发,把这种标签传播算法与正交鉴别分析算法相结合,提出了一种基于协同表示标签传播的半监督正交鉴别分析算法,目的是为了学习一个更好的鉴别子空间.不同于传统的半监督降维方法,所提算法首先利用这种标签传播算法将部分有标签数据的标签信息传递给不带标签的数据,之后利用传播后获得的全体软标签信息构造离散度矩阵实现鉴别分析,其次对鉴别投影施加正交约束,采用一种更加有效快速的迹比优化算法进行鉴别分析.大量的实验结果验证了所提算法的有效性.尤其在只存有少量标签样本的情况下,算法仍能保持良好的分类性能. 相似文献
6.
植株病虫害的识别能够有效地提高农作物产量,当前数据驱动的深度植株病虫害识别方法需要大量的有标签数据,导致现有方法难以很好地识别少样本的新病虫。且基于深度学习的方法需要对大量的参数进行训练,难以削减计算开销。研究设计一种基于彩票迁移的稀疏网络植株病虫害识别模型:定义深度网络的彩票迁移假设,利用压缩策略构建稀疏网络,识别迁移源域的本质知识,提高深度网络的迁移效率;然后,设计深度彩票迁移算法,训练植株病虫害深度识别模型,解决少样本病虫识别调整;最后,在典型的通用数据与植株病虫害识别数据集上,验证基于彩票迁移的深度植株病虫害识别模型能高效迁移源域的本质知识。在PlantVillage数据集上,对植株病虫害识别准确率为97.69%,且所需训练的参数只有原始网络的约30%。 相似文献
7.
《广西师范大学学报(自然科学版)》2021,39(2)
近年来,神经机器翻译模型已经成为机器翻译领域的主流模型,如何从大量的训练数据中快速、准确地学习翻译知识是一个值得探讨的问题。不同训练样本的难易程度不同,样本的难易程度对模型的收敛性有极大影响,但是传统的神经机器翻译模型在训练过程中并没有考虑这种差异性。本文探究样本的难易程度对神经机器翻译模型训练过程的影响,基于"课程学习"的思想,为神经机器翻译模型提出了一种基于样本难度的动态学习方法:分别从神经机器翻译模型的翻译效果和训练样本的句子长度2方面量化训练样本的难易程度;设计了由易到难和由难到易2种学习策略训练模型,并比较模型的翻译效果。 相似文献
8.
图像检索中基于记忆与半监督的主动相关反馈算法 总被引:3,自引:0,他引:3
为快速提高相关反馈算法的效率,提出一种记忆与半监督相结合的主动相关反馈算法.在检索初期,利用记忆信息获得较多的正训练样本,利用用户已标记样本与数据库内未标记样本有效地解决训练样本不平衡问题,获得准确的初始SVM分类器;在检索后期,利用主动学习算法寻找数据库内对优化学习过程中最有用的样本请求用户标记,减少用户标记的样本量,加快收敛速度.对5000幅Corel图像数据库的实验表明,与传统相关反馈算法相比,新算法能够显著提高学习器的效率和性能,并快速收敛于用户的查询概念. 相似文献
9.
利用主动学习改进遥感图像单类分类: 以正类和未标记样本学习方法为例 总被引:1,自引:0,他引:1
针对单类分类方法中只用正类训练样本导致训练样本数量和质量的选择直接影响分类结果精度的问题, 以正类和未标记样本学习(PUL)为例, 研究如何利用主动学习选择训练样本, 以求改善单类分类的精度。首先用随机选取的训练样本进行PUL分类, 直到获得稳定的分类精度, 然后利用主动学习选择和增加最有用(informative)的正类或负类样本, 用于PUL分类。结果表明, 当利用足够多的随机选取的正类样本得到稳定的分类精度后, 利用主动学习选择和增加正类样本可以提高分类精度; 利用主动学习的同时加入正类和负类样本, 可以得到比只加入正类样本更高的分类精度; 将利用主动学习得到的正类样本经相似性筛选后得到的正类样本, 分类精度与直接利用主动学习选择的样本相似, 但达到同样精度时需要更少的样本。因此, 利用主动学习选择和增加样本可以有效地改善单类分类的精度。 相似文献
10.
《南京大学学报(自然科学版)》2021,(1)
甲状腺癌是内分泌系统最常见的恶性肿瘤,甲状腺病理图像对于甲状腺癌的分级、预后和后续治疗有重要的指导作用.近年来,深度学习在病理图像分类分级中表现出色,然而,为了获得良好的分类性能,这些方法往往需要大量的标注数据.众所周知,医学图像的手动注释非常繁琐、耗时,并且需要领域知识的指导.为了降低标注成本,提出一种将卷积神经网络(Convolutional Neural Networks,CNN)和主动学习相结合的分类方法,无须标记所有数据,仅选择少量样本进行标注.此方法利用CNN提取病理图像的特征,进而使用该特征计算未标注样本的不确定性和相似性,选择"有价值"的样本;然后由病理学家对选定的样本进行标注,并不断微调网络以增强模型的分类性能.在甲状腺病理图像上的实验结果表明,该方法能够在不牺牲最终分类准确率的情况下降低标记成本. 相似文献
11.
《华中科技大学学报(自然科学版)》2016,(1):36-40
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度. 相似文献
12.
《辽宁工程技术大学学报(自然科学版)》2017,(3)
为解决由训练样本局限性导致因素分析法中测试样本错误识别和无法识别的问题,进一步提高因素库对样本信息的利用,采用样本培育的方法,对离散决策表的修炼培育作了具体表述:利用初始训练得到的规则集对新增样本进行测试,加入反馈机制,对训练集进行多重训练,直至初始测试准确率不变.研究结果表明:样本培育方法能及时地用新增训练数据改写推理规则,更好地实现样本信息的利用价值. 相似文献
13.
《山西师范大学学报:自然科学版》2020,(3)
大数据时代为深度学习在语音识别中的应用提供了良好的平台.本文介绍了用于语音识别的深度学习模型及用于语音识别的深度学习的学习过程.语音识别技术中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配,而数据的可靠和有效依赖于算法的可行性.在大数据基础上,深度学习用于语音识别大大提高了识别率. 相似文献
14.
针对微阵列癌症数据的特点, 提出一种能识别数据集中误标记样本和异常样本的广义CL stability算法. 该算法以CL-stability为基本算子, 通过样本的全局稳定性识别误标记样本或异常样本. 实验结果表明, 广义CL-stability算法对于识别微阵列癌症数据中的误标记样本优于已有算法, 并能给出区分误标记样本和异常样
本的信息. 相似文献
15.
《中国科学技术大学学报》2018,(6)
金融机构结合消费者和商业信息来为企业进行信用打分.我国的企业特别是小微企业信用信息少,造成了只有少量企业拥有信用信息,而大量企业没有信用信息的局面.半监督支持向量机可以利用标记数据和未标记数据进行学习,同时可以克服信用数据类别不均衡和样本信息不足等问题.由于半监督支持向量机的参数对算法效果有较大影响,实际参数选取往往根据经验所得.为此提出了一种利用模拟退火(SA)优化基于确定性退火半监督支持向量机(DAS3VM)参数的SAS3VM算法.该算法在少量有标记信用数据的基础上,利用大量无标记信用数据辅助学习,使用模拟退火寻找最优参数.最后在两组企业信用数据集和三组个人信用数据集上进行对比实验,结果表明,半监督学习方法(DAS3VM和SAS3VM)优于监督学习方法,SAS3VM在准确率上比DAS3VM最大提升了13.108%. 相似文献
16.
路面裂缝形状不规则复杂程度高。传统路面裂缝识别技术需要对路面图像进行复杂预处理工作进行识别,不能自动化对路面裂缝图像进行分类。为提高对路面裂缝识别精度和效率,本文将基于深度学习方法提出一种自动识别路面裂缝并能减少图像预处理工作量的方法。首先,将原始图像切割为小样本图像,根据图像多特征进行分类,各选取相同类型样本2000张图像构建数据集;其次,利用双线性内插法对裁剪后图像进行上采样,凸显图像特征便于神经网络学习;最后,使用深度学习神经网络对训练样本进行特征提取训练模型。实验结果表明:ResNet101模型评估指标均优于其他深度学习模型和机器学习模型,模型测试精度达0.898,kappa系数为0.815。 相似文献
17.
洞库类目标是高价值识别目标,针对洞库类目标样本数据难以获得、样本内部数据相似度较高、人工设计识别特征方法局限性较大、普通深度网络需要海量数据等问题,提出了结合元学习和深度卷积网络的元-卷积网络(MCNN),并融合持续学习理论的洞库类目标识别方法(MCNN-LLS).首先结合深度卷积网络、元学习的理论建立元-卷积网络,该网络可利用旧知识指导新知识的训练,利用小样本数据即可训练得到识别能力较高的深度洞库模型;然后融合持续学习理论,建立持续学习系统(LLS),设计专家审核模型判别深度洞库模型的识别结果,并引入潜在任务、模型异步更新等方法,达到模型持续学习、持续更新的效果.实验表明,本文方法所需样本数量少,对洞库类目标识别准确率高,且识别能力可随识别过程中新数据的积累逐步提高. 相似文献
18.
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力. 相似文献
19.
20.
神经网络在岩石多角度偏振光谱识别中的应用 总被引:1,自引:1,他引:0
依据岩石多角度偏振光谱反射特征数据,运用神经网络方法,对反射特征相近的岩石加以识别.在识别中以不同方位角、反射角及入射角的反射比等参数作为训练样本及测试样本,训练样本经过网络学习、训练得到神经网络模型,测试样本对神经网络模型进行检验,实验证明将神经网络应用于岩石多角度偏振遥感技术是岩石识别的一种切实可行的方法. 相似文献