首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统的视觉分类方法普遍忽视了多标签间的相关性和大量相关源数据的判别信息.为此,基于共享子空间和领域适应学习方法,针对多标签视觉分类问题,提出了一种新的联合子空间和多源适应学习的多标签视觉分类方法,简称为多源适应多标签学习(Multi-Source adaptation Multi-Label learning,MSML).MSML将综合考虑多标签相关性、灵活的特征相似性嵌入和多源模型的适应学习等目标,并将其融为一个统一的学习模型,其全局最优解只需通过一个广义特征分解问题的求解便可获得.在视频概念识别、自动图像标注等实际应用中进行比较分析,结果显示了本文方法的有效性和优越性.  相似文献   

2.
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大.   相似文献   

3.
针对大量有标签样本的数据驱动模型方法存在数据分布不完备问题,结合实际环境中通信信号样本差异大的特点,提出一种对抗域适应迁移算法.通过类判别器和域判别器对抗训练,使特征提取器能够提取到既具有类差异性又具有域不变性的特征.以无监督学习方式对目标域信号进行分类,以提升调制识别算法在实际环境中拟合存在分布差异数据集的自适应能力.对实际信号样本集中调制方式相近的9类调制信号在不同信噪比条件下进行测试,域适应迁移方法通过对抗训练有标签高信噪比的源域样本和无标签低信噪比的目标域样本,结果发现该算法的平均识别准确率较以往直接训练的平均识别准确率大幅提升.  相似文献   

4.
针对缺失属性值数据分类算法中模型分类精度和泛化能力低的问题, 提出一种基于模糊规则的缺失属性值数据分类算法, 即“循环 接收”模型. 该算法不需要对缺失属性值数据进行插补运算, 可直接对该数据集进行分类. 对UCI公开数据集进行模拟仿真实验, 实验结果表明, “循环 接收”模型与其他算法相比具有更高的分类精度和泛化能力.  相似文献   

5.
随着数据挖掘技术在现实问题中的广泛应用,多标签学习现已成为数据挖掘技术中的一个研究热点.组合分类器链(ECC)算法是一种性能较好的多标签分类方法,其分类效果好、准确度高,但该算法的时空复杂度较高,不能适应大规模多标签数据分类任务.为此提出了一种基于Spark的组合分类器链多标签分类方法,将串行组合分类器链算法的各步骤进行了并行化实现.通过单机实验和集群并行化实验,证明该方法对大规模多标签数据集具有良好的适应能力和加速比,且分类效果不输于传统的串行多标签分类方法.  相似文献   

6.
作为一类网络安全的基础研究,网络异常检测技术目前还存在检测准确率低、误报率高以及缺乏标签数据等问题。为此提出一种融合联邦学习和卷积神经网络的网络入侵检测分类模型(CNN-FL),可有效解决多个参与者在不共享隐私数据的情况下进行一个全局模型的协作训练时所带来的问题。该模型无需汇集模型训练所需要的数据进行集中计算,只是传递加密的梯度相关数据,即可利用多源数据协同训练同一模型,并解决缺乏标签数据的问题。随后将该模型应用于二分类和多分类方法中,并在同一基准数据集NSL-KDD上进行了实验比较与分析,实验结果表明,与其他研究方法相比,所提CNN-FL分类模型在二分类以及多分类中具有较高的识别性能和分类精度。  相似文献   

7.
本文提出了一种基于编码解码器与深度主题特征的模型,实现了多标签文本分类.针对传统多标签文本分类方法的特征语义缺失的问题,采用一种长短时记忆(long short-term memory,LSTM)网络提取文本的局部特征与主题模型(latent dirichlet allocation,LDA)提取文本的全局特征的深度主题特征提取模型(deep topic feature extraction model,DTFEM),得到具有文本深层语义特征的语义编码向量,并将该编码向量作为解码器网络的输入.解码器网络将多标签文本分类的任务看作序列生成的过程,解决了多标签文本分类的标签相关性的问题,并加入attention机制,计算注意力分布概率,突出关键输入对输出的作用,改进了由于输入过长导致的语义缺失问题,最终实现多标签文本分类.实验结果表明,该模型能够获得比传统的多标签文本分类系统更优的结果.另外,实验证明使用深度主题特征的方法可以提高多标签文本分类的性能.  相似文献   

8.
针对工业过程中故障诊断面临的工况突变而导致模型数据分布失配的问题,提出基于联合均值差异匹配的域适应故障诊断方法。利用源域和目标域每类样本的均值定义类内差异和类间差异,同时集成最大方差和最大均值差异准则获取特征投影矩阵,并将源域和目标域的特征信息投影到公共特征子空间。在子空间建立K近邻(KNN)分类模型,完成故障诊断分类。实验结果表明,该算法能够较为准确地完成故障分类,具有较高的分类准确性。  相似文献   

9.
针对超多标签分类(SMLC)带来的数据稀疏性和可扩展性等问题,根据深度卷积神经网络(CNN)提出了基于层次型标签集的文本分类方法,以完成数据标签规范化.该方法对每个文档的标签集进行扩展,并整合了标签层次结构中所有缺失的标签.通过CNN实施特征提取模块,以及由全连接神经网络组成分类模块.此外,分析了在输入训练文本的表征中使用不同类型的嵌入模型及其不同组合的影响.实验使用公开的PubMed科研文献集对所提方法进行评估,实验结果证明了所提方法能够处理高复杂性问题;在层次型度量和平均准确率方面,该方法优于一些现有的方法.  相似文献   

10.
专家可为社区问答提供权威的答复,高效精准的专家发现有助于提升问答社区的服务质量.现有社区用户数据中存在噪声标签数据,且由于专家数量较少造成分类数据不平衡,从而降低了监督学习模型的专家发现精度.针对上述问题,本文提出一种基于特征扰动的半监督专家发现方法.该方法构建了一种无标签数据特征扰动策略,利用Sharpening算法实现无标签数据的伪标签化;基于ADASYN算法,通过构建专家用户邻近样本的方式扩充专家样本数据量,缓解分类数据的不平衡;构建联合损失函数,利用有标签和伪标签数据共同训练分类器,增强模型的泛化性能.实验结果表明,该方法在多个评价指标上优于已有模型和方法.  相似文献   

11.
在近红外光谱分析中,已有的标定迁移方法多基于标准样本和无参数归纳模型,普遍存在模型生存周期短、适用范围小等问题.针对此问题,提出了一种参数化对齐源域(主仪器)和目标域(从仪器)特征分布的变分推断标定自适应(variational inference calibration adaptation, VICA)方法.VICA对源域数据进行主成分分析,建立源域特征的变分回归模型.在预测时,VICA首先将目标域数据投影到源域特征子空间中,然后建立源域特征和目标域特征的分布差异函数,通过最小化该函数得到目标域的概率密度模型,实现模型迁移.实验对比表明,VICA比现有的大多数标定迁移方法的标定效果更好.  相似文献   

12.
基于数据驱动方法诊断滚动轴承故障时,不同工况下的数据特征分布差异会导致模型诊断性能严重下降.针对这一问题,提出了基于域适应与分类器差异的滚动轴承跨域故障诊断方法.首先利用卷积神经网络对带标记的源域样本和无标记的目标域样本进行特征提取;然后通过2个全连接分类器进行故障分类;最后通过分步优化分类损失、域最大平均差异损失和分...  相似文献   

13.
针对不同工况下的数据无法直接训练并用于检测的问题,提出一种基于迁移成分分析和词包模型的诊断算法,对于用作训练的有标签源域数据和用作检验诊断的无标签目标域数据。首先使用短时傅里叶变换将两者转换为频域数据,其次通过迁移成分分析将两者的频谱能量映射到同一分布以建立相应的词包模型作为数据的特征,最后在源域数据的词包模型上训练出合适的分类器从而进行诊断。在西门子SQI-MFS平台实验数据集、凯斯西储大学公开数据集及机械故障预防技术协会MFPT(machinery failure prevention technology)数据集下的实验结果表明该算法是有效的。  相似文献   

14.
多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的多标签文本分类方法 LEKA (Label Embedding and Knowledge-Aware).该方法依赖于文档文本以及相应的多个标签,通过标签嵌入来获取与标签相关的注意力.考虑标签的语义信息,建立标签与文档内容的联系,将标签应用到文本分类中.另外,为了增强标签的语义信息,通过知识图谱嵌入引入外部感知知识,对标签文本进行语义扩展.在AAPD和RCV1-V2公开数据集上与其他分类模型进行了对比,实验结果表明,与LCFA (Label Combination and Fusion of Attentions)模型相比,LEKA的F1分别提高了3.5%和2.1%.  相似文献   

15.
针对多标签数据类别间的相关性与共现性,提出了一种使用自适应线性回归的多标签分类算法,将经典线性回归理论推广到多标签形式,结合多种评判标准对回归结果设置阈值,进而自适应地预测出最终标签.该方法同时考虑了符合数据期望的固定阈值与反映分类器综合效果的自适应阈值,因而降低了数据分布与噪声对分类的影响.实验结果表明,该方法可以有效地解决多标签分类问题.  相似文献   

16.
多标签分类是一项重要且具有挑战性的任务,对于场景分类、信息检索和网页挖掘等领域有重要意义.近年来,研究者倾向于挖掘并利用标签相关性以及实例相关性来提升多标签分类的性能,其中利用这类相关性来解决多标签分类中的标签缺失问题一直是机器学习领域的热门研究点,但现有的方法都忽略了标签和实例之间的相关性.针对标签完整和标签缺失的情况,基于矩阵分解的方式分解得到实例和标签的特征表示矩阵,在利用标签相关性和实例相关性建立正则约束的同时,首次建立实例和标签特征表示间的相关性并用以建立正则约束,进而提升算法性能.在三个真实数据集上对提出的算法进行性能验证,实验结果表明,该算法和对比算法相比,获得了最高的预测精度.  相似文献   

17.
汪云云  桂旭  郑潍雯  薛晖 《广西科学》2022,29(4):660-667
域适应(Domain Adaptation,DA)学习旨在利用标签丰富的源域来帮助标签稀缺的目标域学习。DA方法通常假设源域数据已正确标记,然而现实中通常很难收集到大量带有干净标签的源实例,带有噪声源标签的噪声DA学习可能会降低目标学习性能。为此,本文提出基于自适应标签噪声校正的鲁棒DA学习方法(Robust DA Method through Adaptive Noise Correction,RoDAC)。RoDAC包含两个学习阶段,即自适应噪声标签检测(Adaptive Noise Label Detection,ANLD)和自适应噪声标签校正(Adaptive Noise Label Correction,ANLC)。在ANLD中,使用自适应噪声检测器识别带有噪声标签的源实例,并进一步在ANLC中自适应地校正噪声标签,将其重新投入域适应学习中。与基准数据集进行比较,结果表明RoDAC方法在源域标签存在噪声的域适应场景中取得了显著的性能提升。该学习策略可集成至许多现有的DA方法中,以提升其在噪声标签场景下的学习性能。  相似文献   

18.
数据集独立同分布(Independent and identically distributed, IID)的假设和数据集是否干净,分别对应组合域标签噪声领域数据集非独立同分布(Non-independent and identically distributed, Non-IID)和标签噪声问题。该文提出多标签图像多分类模型(Multi-label image multi-classification model, MIMM)预处理方法应对上述问题。为了缓和数据集独立同分布假设,该文证明组合域方法的迁移误差上界,并使用最大关键特征(Maximum key feature, MKF)函数和关键秩匹配分解(Key rank matching decomposition, KRMD)算法实现源域向组合同构数据的目标域迁移。为了保证数据集干净,引入干净的第三方数据微调模型参数,排除标签真实数量不确定导致训练集类别不平衡的情况。在Pascal/COCO数据集上进行实验,结果证明MIMM方法已达到准确率与运行效率的最佳平衡。  相似文献   

19.
层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中.当利用HMC-loss预测时,尽管得到的损失值是理想的,但实际预测的标签数却远多于真实的标签数.另外,层次信息的引入会对标签结点的决策顺序产生不利影响.针对这些问题,首先提出改进的损失函数IMH-loss,其次使用贝叶斯决策理论,提出了一种贝叶斯风险随决策过程可变的层次多标签分类方法.在真实数据集上的实验结果表明,该方法在保证召回率的同时,提升了标签预测精度.  相似文献   

20.
徘徊行为判定作为异常行为识别的热点难题,目前存在难以构建具有场景特定性的识别模型问题.特定场景下的行人轨迹数据,或是有标签,或是无标签,针对如何利用特定场景下有标签轨迹数据信息问题,结合行人多种轨迹特征,提出基于分类函数的徘徊行为识别模型,能够通过分类函数自动学习该场景下有标签轨迹数据中的徘徊行为模式;针对如何利用特定场景下无标签轨迹数据信息问题,提出基于异常检测的徘徊行为识别模型,能够在大量无标签轨迹数据中自动学习潜在的徘徊行为模式.基于两种徘徊行为识别模型,提出徘徊行为识别框架,能够利用目标跟踪算法获取特定场景视频中行人的轨迹数据,并根据数据是否带有标签合适地构建对应的具有场景特定的徘徊行为识别模型.为了验证所提模型的有效性,选用CASIA-AR公开数据集作为测试集,和三种基准模型一起,在行走、奔跑和徘徊行为的识别上进行了对比实验.实验结果表明,所提模型在测试集上的准确率和召回率都优于基准模型,F1指标也有提升,验证了所提模型的有效性、场景特定性和迁移性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号