首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
文本情绪多标签分类是一种细粒度的文本情感分析,通过挖掘文本中蕴含的多种情绪信息,为文本分配多种所属的情绪标签。文章提出一种基于标签特征的卷积神经网络(CNN)情绪多标签分类方法,首先利用word2vec模型对文本进行词向量表示,然后利用标签特征来强化文本情绪和标签之间的联系,将其融合于CNN模型中,用于对文本情绪进行深层次的表示和多标签分类。为了验证方法的有效性,选取了CLR和LPLO两个多标签分类方法作为基准方法,在NLPCC2014的中文微博情绪分析数据集进行比较实验。结果表明,使用标签特征的CNN模型,可以提升微博情绪的分类性能。  相似文献   

2.
多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的多标签文本分类方法 LEKA (Label Embedding and Knowledge-Aware).该方法依赖于文档文本以及相应的多个标签,通过标签嵌入来获取与标签相关的注意力.考虑标签的语义信息,建立标签与文档内容的联系,将标签应用到文本分类中.另外,为了增强标签的语义信息,通过知识图谱嵌入引入外部感知知识,对标签文本进行语义扩展.在AAPD和RCV1-V2公开数据集上与其他分类模型进行了对比,实验结果表明,与LCFA (Label Combination and Fusion of Attentions)模型相比,LEKA的F1分别提高了3.5%和2.1%.  相似文献   

3.
为了从文本中可以更加准确地分析其蕴含的内容,给人们的生产生活提供建议,在基于深度学习的传统多标签分类方法的基础上,提出一种融合多粒度特征和标签语义共现的多标签分类模型。该模型利用双向长短时记忆网络双向长短时记忆网络(bidirectional long short-term memory network, Bi-LSTM)提取多粒度的文本特征,获得不同层次的文本特征;并通过计算pmi的方式构建标签关系图,利用图卷积网络(graph convolution network, GCN)深入提取标签的隐藏关系,获得具有标签信息的文本表示;最终融合多粒度文本特征,进行多标签文本分类。在AAPD和news数据集上进行实验。结果表明:所提出模型的Micro-F1值分别达到0.704和0.729,验证了模型的有效性。  相似文献   

4.
多标签分类中,一个样本可能属于多个类别,且在小样本场景下模型性能更容易受到样本中复杂语义特征的影响。然而,目前常用的原型网络方法仅使用每类支持集样本的均值作为标签原型,导致原型中存在其他类别特征带来的噪声,弱化了原型间的差异性,影响预测效果。本文提出一种利用实例级注意力的多标签小样本原型网络分类方法,通过提高支持集中与当前标签关联度高的样本的权重,减少其他标签特征的干扰,增大标签原型之间的区分度,进而提高预测的精确率. 实验表明,方法通过引入实例级注意力强化了多标签原型网络的学习能力,分类效果明显提升.  相似文献   

5.
传统的多标签文本分类算法往往只关注文本本身的信息,在挖掘标签间的关联信息过程中存在不足,很大程度上影响了模型的分类性能。为了充分利用标签信息捕获标签之间的依赖关系,提出一种融合注意力与CorNet的多标签文本分类算法。该算法针对文本内容编码部分,使用双向长短时记忆网络获得文本语义表示,通过多标签注意力机制捕获文本中的重要单词;同时,针对标签编码部分,利用图注意力网络捕获标签间的依赖关系,设计“文本-标签”注意力机制将其与文本上下文语义信息进行交互,获得基于标签语义信息的文本特征表示;最后,使用自适应融合机制将上述两部分融合,并通过CorNet模块学习标签相关性以增强标签预测。在AAPD、RCV1-V2和Reuters-21578数据集上的实验结果表明,所提出的算法能够有效捕获标签之间的依赖关系,其性能优于当前主流的多标签文本分类算法。  相似文献   

6.
在多标签分类的相关研究中,由于现有的基于网络表示学习算法的相关方法只利用了网络中节点之间的邻接领域信息,而没有考虑到节点之间的结构相似性,从而导致分类准确性较低,因此,本文提出一种基于深度自动编码器的多标签分类模型。该方法首先利用轨迹计算算法(Orca)计算不同规模下网络中节点的结构相似性,作为深度自动编码器的输入来改进隐藏层中的向量表示,保留网络的全局结构;然后利用节点的邻接领域信息在模型中进行联合优化,从而能有效地捕捉到网络的高度非线性结构;最后根据隐藏层得到节点的向量表示,利用支持向量机对节点进行多标签分类。验证实验采用3个公开的网络数据集,实验结果表明,与基准方法相比,本文方法在多标签分类任务中能取得更好的效果。  相似文献   

7.
多标签分类是指数据可以同属于多个类的分类问题,其数据特征和标签间相关性对分类结果存在影响。因此,提出一种融合前述两种因素的多标签分类算法。将数据用核函数进行特征映射,根据训练数据的k-邻域计算得到每个标签的最大后验概率;并将其加入到对应的数据特征中。用加入最大后验概率的数据特征训练分类器。通过在经典的yeast、scene和emotion数据库上实验,证明了算法的有效性。  相似文献   

8.
多标签分类中如何有效处理具有许多实例和大量标签的大规模数据集、补偿训练集中缺失标签以及利用未标记实例改进预测性能等问题已成为重要研究方向。提出嵌入式多标签分类(EMC)算法,首先从伪实例参数化的高斯过程(GP)中提取两组随机变换来模拟特征向量、潜在空间表示向量和标签向量之间的非线性关系映射,其次引入一组辅助变量结合专家集成(EEOE)方法补偿缺失标签,最后利用未标记实例学习随机函数的平滑映射提高预测性能。仿真结果表明,与特征识别隐式标签空间编码的多标签分类(FaLE)算法和半监督低秩映射多标签分类(SLRM)算法相比,EMC算法优化了处理大规模数据集、补偿缺失标签及利用未标记数据的能力,从而提高了类标签的预测性能,且具有良好的可扩展性,训练时间短。  相似文献   

9.
为了实现焊缝缺陷的准确分类,提出一种多特征融合的焊缝图像多标签分类算法.首先,通过残差神经网络(ResNet-50)提取图像的特征信息,根据得到的特征图构建图结构,提出关联度引导邻域传播(RDGNP)算法优化图结构;然后,使用图卷积神经网络(GCN)提取图结构的特征信息,并设计特征融合模块实现图像特征和图结构特征的结合;最后,得到多标签分类结果.实验结果表明:文中算法能够有效地实现焊缝缺陷的多标签分类,在X射线焊缝缺陷数据集上的性能有明显提升.  相似文献   

10.
在层次多标签分类问题中,一个样本同时被赋予多个类别标签,并且这些类别标签被组织成一定的层次结构。层次多标签分类问题的主要挑战在于:①分类方法的输出必须符合标签的层次结构约束;②层次深的节点所代表的标签往往只有很少的样本与之相关,造成标签不平衡的问题。提出一种用于层次多标签分类问题的增量式超网络学习方法(hierarchical multi-label classification using incremental hypernetwork, HMC-IMLHN),通过将超网络的超边组织成相应的层次结构,使输出的预测标签能够满足标签的层次约束。此外,超网络学习方法可以利用标签之间的关联减少标签不平衡问题对分类性能的影响。实验结果表明,与其他层次多标签分类方法相比,提出的增量式超网络方法能够取得较好的分类准确性。  相似文献   

11.
以不完备信息系统为研究对象,在容差关系的基础上提出了一种带有阈值的基于概率相似度的概率容差关系.新模型考虑了属性取值的概率,通过阈值的设置可以控制分类精度,优化分类决策.实例分析验证了新模型的可行性和优越性.  相似文献   

12.
粗糙集理论在多属性决策、数据挖掘、机器学习、人工智能等领域发挥着越来越大的作用。经典粗糙集理论主要利用不可分辨关系对完备信息系统形成的划分来定义知识的上、下近似集,并在此基础上进行知识约简,规则推理和决策。而现实生活中存在大量不完备信息系统。针对不完备信息系统的多属性决策问题,从非对称相似关系的角度提出基于粗集的多属性决策方法。  相似文献   

13.
针对传统KNN算法忽略样本分布对分类的影响,易受到孤立样本、噪音等干扰,时间代价大等问题,提出了一种改进的近邻分类算法.该算法首先采用类维样本存储,打破了样本的整体性,转换了训练样本存储模式;其次按类维度寻求未知样本的类维近邻域,计算类维相似度进而得到未知样本的类别相似度;最后以最大类别相似度标识未知样本.该算法提高了分类效率,降低了独立样本对样本分类的影响.同时可处理连续型和标识型样本分类,并可适应各类样本分布情况,扩大了算法的应用范围.实验结果表明,该算法较传统的近邻算法与邻域分类算法在分类精度与分类时间上有了较大提升.  相似文献   

14.
提出了一种基于双向长短期记忆网络和标签嵌入的文本分类模型。首先利用BERT模型提取句子特征,然后通过BiLSTM和注意力机制得到融合重要上、下文信息的文本表示,最后将标签和词在联合空间学习,利用标签与词之间的兼容性得分对标签和句子表示加权,实现标签信息的双重嵌入,分类器根据给定标签信息对句子进行分类。在5个权威数据集上的实验表明,该方法能有效地提高文本分类性能,具有更好的实用性。  相似文献   

15.
为对网络流量进行准确的分类,对比了基于主干网和基于主机的两种流量采集方案,探讨了这些采集系统的主要作用、采集流量的过程以及如何为采集的流量打上真实应用信息的标记,同时指出现有流量采集方案的优势和不足。  相似文献   

16.
针对现实中的信息系统的不完备缺失属性,以及无法使用Paw lak粗糙集解决属性约简的情况,在经典的Paw lak粗糙集的基础上,引入一般关系下的粗糙集模型,并给出了基于一般关系的信息系统属性约简的定义.为了使不完备信息系统可以得到更好的属性约简,通过对非对称相似关系进行改进,提出了一种基于改进非对称相似关系的粗糙集模型,在此基础上给出了一种新的不完备信息系统的属性约简算法,并用实例说明了其有效性.  相似文献   

17.
不完备信息系统中Rough集的扩充模型   总被引:2,自引:0,他引:2  
经典的Rough集理论所处理的信息系统必须是完备的.为了能够分析处理不完备的信息系统,需要建立新的扩充Rough集模型.对现有的几种比较有影响的Rough集扩展模型进行了分析研究,提出了一种带约束的相似关系Rough集模型,并将这些扩充模型之间的关系进行了分析比较.结果显示,基于约束相似关系的扩充Rough集模型优于基于容差关系的扩充Rough集模型和基于相似关系的扩充Rough集模型,使得对象的划分更加合理,符合人们在处理数据时的直观感觉.  相似文献   

18.
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号