首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
多标签分类是指数据可以同属于多个类的分类问题,其数据特征和标签间相关性对分类结果存在影响。因此,提出一种融合前述两种因素的多标签分类算法。将数据用核函数进行特征映射,根据训练数据的k-邻域计算得到每个标签的最大后验概率;并将其加入到对应的数据特征中。用加入最大后验概率的数据特征训练分类器。通过在经典的yeast、scene和emotion数据库上实验,证明了算法的有效性。  相似文献   

2.
多标签分类是一项重要且具有挑战性的任务,对于场景分类、信息检索和网页挖掘等领域有重要意义.近年来,研究者倾向于挖掘并利用标签相关性以及实例相关性来提升多标签分类的性能,其中利用这类相关性来解决多标签分类中的标签缺失问题一直是机器学习领域的热门研究点,但现有的方法都忽略了标签和实例之间的相关性.针对标签完整和标签缺失的情况,基于矩阵分解的方式分解得到实例和标签的特征表示矩阵,在利用标签相关性和实例相关性建立正则约束的同时,首次建立实例和标签特征表示间的相关性并用以建立正则约束,进而提升算法性能.在三个真实数据集上对提出的算法进行性能验证,实验结果表明,该算法和对比算法相比,获得了最高的预测精度.  相似文献   

3.
多标签文本分类任务存在难以从文本信息中提取标签关联的判别特征,建立标签相关性困难等问题。现有方法主要采用基于RNN的序列生成模型来建立标签高阶相关性,但缺乏对文本语义信息的充分利用。为此文章提出基于Transformer解码器的序列生成模型,使用标签嵌入作为查询,通过其多头自注意力机制建立标签之间的高阶相关性,并利用多头交叉注意力子层从文本信息中自适应地聚合标签相关的关键特征。文章的注意力权重可视化实验表明,序列生成Transformer在建立标签相关性的同时,能够更全面、更深层次地考虑文本和标签之间的语义相关性。与传统RNN类模型相比,序列生成Transformer在分类任务中兼具有效性和可解释性,并在AAPD和SLASHDOT两个数据集上取得了更优的结果。在AAPD数据集上分别取得了70.49%的Instance-F1值和52.04%的Label-F1值,比以往分类效果最好的set-RNN模型分别高1.44%和1.83%。  相似文献   

4.
多标签流形学习(multi-label manifold learning, ML$^{2}$)基于特征流形构建标签流形, 将标签逻辑值转换为实数值, 能更好地反映标签相关性, 提高分类性能. 但是, ML$^{2}$ 与多数多标签分类方法一样, 是基于数据的全部特征进行标签预测, 没有考虑不同特征对不同类别标签的鉴别能力. 因此, 提出一种基于类属特征的多标签流形学习分类(label specific feature based multi-label manifold learning, LSF-ML$^{2}$)方法. 首先, 利用标签数据优化类属特征重要度矩阵, 确定类属特征子集; 再将子集的特征流形映射到标签空间, 使标签从离散型变为数值型; 最后, 通过多输出回归实现分类. 实验结果表明, 所提方法性能优于多种多标签分类方法.  相似文献   

5.
6.
在层次多标签分类问题中,一个样本同时被赋予多个类别标签,并且这些类别标签被组织成一定的层次结构。层次多标签分类问题的主要挑战在于:①分类方法的输出必须符合标签的层次结构约束;②层次深的节点所代表的标签往往只有很少的样本与之相关,造成标签不平衡的问题。提出一种用于层次多标签分类问题的增量式超网络学习方法(hierarchical multi-label classification using incremental hypernetwork, HMC-IMLHN),通过将超网络的超边组织成相应的层次结构,使输出的预测标签能够满足标签的层次约束。此外,超网络学习方法可以利用标签之间的关联减少标签不平衡问题对分类性能的影响。实验结果表明,与其他层次多标签分类方法相比,提出的增量式超网络方法能够取得较好的分类准确性。  相似文献   

7.
多标签分类中如何有效处理具有许多实例和大量标签的大规模数据集、补偿训练集中缺失标签以及利用未标记实例改进预测性能等问题已成为重要研究方向。提出嵌入式多标签分类(EMC)算法,首先从伪实例参数化的高斯过程(GP)中提取两组随机变换来模拟特征向量、潜在空间表示向量和标签向量之间的非线性关系映射,其次引入一组辅助变量结合专家集成(EEOE)方法补偿缺失标签,最后利用未标记实例学习随机函数的平滑映射提高预测性能。仿真结果表明,与特征识别隐式标签空间编码的多标签分类(FaLE)算法和半监督低秩映射多标签分类(SLRM)算法相比,EMC算法优化了处理大规模数据集、补偿缺失标签及利用未标记数据的能力,从而提高了类标签的预测性能,且具有良好的可扩展性,训练时间短。  相似文献   

8.
将粗糙集优越的约简理论应用于多标签文本分类,提出了基于粗糙集理论的多标签文本分类算法,该算法利用训练阶段得到的各个类别的分类规则与测试实例逐一匹配,得出实例的类标签集合,扩展了粗糙集理论在文本分类中的应用,实验证明算法有效可行.  相似文献   

9.
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大.   相似文献   

10.
为了将标签间的语义相关性引入多标签图像分类模型中,传统的方法例如 ML-GCN 通过设置单阈值将标 签条件概率矩阵二值化为标签共现矩阵,然而,仅设置单阈值很难归纳所有的标签语义关系情况。 针对这一问题, 提出一种融合标签间强相关性的多标签图像分类方法—MGAN(Multiple Graph Convolutional Attention Networks), 通过设置多个阈值,将传统的标签条件概率矩阵按照不同的相关性程度分割为多个子图;同时,为了提升多标签分 类性能,也引入图像区域空间相关性。 另外,针对传统的“CNN+GCN”方法将标签与特征的融合张量视为预测分数 缺乏可解释性问题,将标签与特征的融合张量视为注意力分数;在 MS-COCO 和 PASCAL VOC 数据集上与其他主 流多标签图像分类方法进行了对比实验,平均准确率分别达到了 94. 9%和 83. 7%,相较于经典 ML-GCN 模型,分 别获得了 0. 9%和 0. 8%准确率提升,且在“Binary”和“Re-weighted”邻接矩阵模式下,MGAN 都有较好的表现,验证 了新的融合方法可以缓解图卷积神经网络过平滑问题对多标签图像分类的影响。  相似文献   

11.
在智能交通系统中,交通状态预测发挥着至关重要的作用。针对现有的交通预测方法集中于中微观层面,且时间和空间维度单一的问题,提出了一种面向区域宏观交通状态预测的集成模型。该模型以交通指数为依据,在时间维度上采用时间序列预测方法获得时间预测结果,在空间维度上采用支持向量回归方法获得空间预测结果,并在集成模型中将两者的结果融合。在交通指数云图上的实验结果表明,与单一维度的时间或空间模型相比,该模型能显著提高预测精度。  相似文献   

12.
一种考虑用户兴趣转移特征的协同预测模型   总被引:1,自引:0,他引:1  
大多数预测模型使用用户属性或社交关系信息来优化预测结果,然而真实系统中用户的属性或社交关系信息往往很难获得,或者取得的是虚假信息,从而导致用户行为表达不准确或模型不具有普适性.另外,几乎所有使用用户特征的模型仅考虑用户兴趣本身的度量,而忽视兴趣的变化这一重要特征.因此,本文提出一种考虑用户兴趣转移特征的协同预测模型.该模型根据用户连续行为序列构建用户兴趣转移特征和用户行为演变网络,利用用户兴趣转移特征计算用户相似性,进而搜索最近邻集合,利用用户行为演变网络筛选候选集,最后设计最频繁项提取算法来产生预测结果,从而构建用户行为的预测模型.在真实的新闻浏览日志、交互式网络电视视频访问日志和微软服务器日志上的实验表明该预测模型是有效的.  相似文献   

13.
考察H2 S、CO2等酸性气体在液体介质中的溶解度对同区块不同井或同井不同井段油套管腐蚀、开裂及氢脆等环境断裂情况的影响,基于模拟油气井环境下CO2溶解度的测试装置,开展CO2在不同温度、压力及矿化度下的溶解度试验,采用灰色关联度法从温度、压力及矿化度3个方面对CO2溶解度进行敏感性分析,得到CO2溶解度与温度、压力及...  相似文献   

14.
疾病预防促进了预测模型的发展,但如何提高预测模型的精确度,就目前文章还没有提出一个综合性的措施.通过对国内外大量文献进行交叉性和多维性对比,寻求从各个模块改善心血管疾病(CVD)风险预测模型精确度的措施.手动检索395篇国内外在医学期刊上具有高影响力的文献,对文献进行统计和归类,并创新地提出不同数据分析方法和图、表分析...  相似文献   

15.
Present monitoring and prediction of schistosomiasis's intermediate parasite, snail, are based on remote sensing image's spectral signatures, and the calculation result is in fact an incomplete-constraints solution. TM image of the Poyang Lake region on October 31, 2005 was combined with GIS thematic data (DEM, boundary of the Poyang Lake, vegetation, soil and land use) to make a prediction on snail spatial distribution in the region by remote sensing, geo-informaUcs and knowledge-driven modeling according to mechanism of snail occurrence. Result shows that with change of overall fuzzy membership of snail occurrence from high to low, snail occurrence of the snail samples of validation group goes up to 81% within 10% high fuzzy membership range, denoting high efficiency of the model in predicting snail occurrence.  相似文献   

16.
Present monitoring and prediction of schistosomiasis’s intermediate parasite, snail, are based on re-mote sensing image’s spectral signatures, and the calculation result is in fact an incom-plete-constraints solution. TM image of the Poyang Lake region on October 31, 2005 was combined with GIS thematic data (DEM, boundary of the Poyang Lake, vegetation, soil and land use) to make a prediction on snail spatial distribution in the region by remote sensing, geo-informatics and knowl-edge-driven modeling according to mechanism of snail occurrence. Result shows that with change of overall fuzzy membership of snail occurrence from high to low, snail occurrence of the snail samples of validation group goes up to 81% within 10% high fuzzy membership range, denoting high efficiency of the model in predicting snail occurrence.  相似文献   

17.
基于小波网络的非线性经济时序预测模型   总被引:1,自引:1,他引:0  
为对经济时序准确预测,必须先对其数据结构进行分析,相空间重构技术为之提供了理论基础,通过关联维数的计算,区分确定性系统和随机系统.在此基础上确定最佳嵌入维数、最佳采样时间间隔及小波元的个数,并通过带有偏差单元的递归小波网络的学习,进行模型参数的辨识.实验研究表明,模型对非线性经济时序具有良好的逼近能力,因此该模型用于非线性经济时序预测具有可行性。  相似文献   

18.
混沌时间序列局域预测模型及其应用   总被引:4,自引:0,他引:4  
为了确定滞时、嵌入维数和最邻近点数运3个混沌时间序列局域预测模型参数,首先利用关联积分法确定滞时和嵌入维数.重构混沌时间序列的相空间;而后在此基础上,提出一种新的预测模型——加权动态局域预测模型.该模型综合考虑了广义自由度和邻近点权重,给出了确定最优邻域的判定指标.实际水文系统的计算分析表明,加权动态局域预测模型具有较高的预测精度,是一种有效的用于混沌水文时间序列的预测模型.  相似文献   

19.
针对目前对网格资源提前预留的研究主要集中在资源预留算法上,几乎忽略了如何估算用户资源需求量问题,提出一种适用于网格资源预留的用户资源需求量预测模型.基于对网格资源提前预留请求的定义,结合GM(1,1)灰色预测方法,建立了用户资源需求量预测模型,并提出相应的改进方法,提高了预测精度.模拟实验证明了模型的有效性,能获得较好的预测效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号