首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种基于Markov随机游走的渐进式半监督分类模型:在随机游走过程中,计算待标注数据到各类的迁移概率时,只考虑相应类别样本的影响,而忽略其他类别样本对随机过程的影响;并在学习过程中借鉴渐进学习思想,通过不断地“纠正”半监督学习过程中的“错误”,从而提高模型的预测精度.在20newsgroups数据集上的实验结果表明:所提出的方法能够提高半监督分类的精度.  相似文献   

2.
3.
针对新生儿疼痛表情识别任务中由于有类别标签样本数量不足而导致分类准确率不高的问题,提出了 一种基于图的半监督深度学习(Graph-based Semi-supervised Deep Learning,GSDL)方法.首先,使用训练集中少量有类别标签的样本对深度神经网络模型进行初步训练,得到初始模型;然后,利用初始模型...  相似文献   

4.
"语义鸿沟"是基于内容图像检索中广泛存在的问题。近年来,人们为减小语义鸿沟开展了许多研究工作,并将半监督学习方法用于其中。目前,多数的检索方法只考虑数据点的结构信息,或关注点集中在低层特征。为了充分利用结构信息缩小低层特征和高层语义之间的语义鸿沟,提出了一种半监督的双映射机器学习图像检索法。该方法在低层特征与标签之间建立双线性映射,最后使用Corel图像库同流行嵌入法进行对比,实验表明所提出的方法在检索过程中可以获得较好的效果,精准率有明显提高。  相似文献   

5.
图像检索中基于记忆与半监督的主动相关反馈算法   总被引:3,自引:0,他引:3  
为快速提高相关反馈算法的效率,提出一种记忆与半监督相结合的主动相关反馈算法.在检索初期,利用记忆信息获得较多的正训练样本,利用用户已标记样本与数据库内未标记样本有效地解决训练样本不平衡问题,获得准确的初始SVM分类器;在检索后期,利用主动学习算法寻找数据库内对优化学习过程中最有用的样本请求用户标记,减少用户标记的样本量,加快收敛速度.对5000幅Corel图像数据库的实验表明,与传统相关反馈算法相比,新算法能够显著提高学习器的效率和性能,并快速收敛于用户的查询概念.  相似文献   

6.
半监督学习研究进展   总被引:14,自引:0,他引:14  
半监督学习问题广泛存在于现实世界中,已经成为目前机器学习和模式识别领域中的一个研究热点.文章综述了半监督学习问题的基本思想、研究现状、常用算法及其一些应用领域,分析了目前存在的主要困难,并指出需进一步研究的几个问题.  相似文献   

7.
半监督学习贝叶斯分类   总被引:1,自引:1,他引:0  
分类器的学习采用半监督贝叶斯方法,使用EM算法求解最大似然估计,实验结果表明能够获得较好的结果。  相似文献   

8.
随着进入大数据时代,"标记数据少,而未标记数据多"的现象越来越普遍.半监督学习是充分利用样本中"廉价"的未标记样本,让学习器不依赖外界交互、自动地利用未标记样本提升学习性能.通过构建多模态概率生成模型对数据进行建模,然后分析该模型上的监督学习过程和非监督学习过程,最后结合两种学习过程实现半监督学习.通过在MNIST数据...  相似文献   

9.
本文主要研究自监督学习方法在视频目标分割中的应用。首先通过挖掘大规模无标注视频数据中的时间-空间关系,让神经网络作为特征编码器学习视频帧之间的相似性和连续性;然后通过记忆力机制训练网络,使其对当前帧和多个参考帧之间的关系进行建模;利用特征编码器学习到的特征对视频帧中的分割目标进行重建,进行下游的视频目标分割任务;最后,利用在线自适应模块对视频分割结果的错误进行修正。实验结果表明,本文的自监督方法在视频分割任务上的表现可以更加接近有监督方法的分割结果,采用记忆力机制和在线自适应模块可以大大提高视频目标分割的准确性。另外本文探究了数据有效性,当采用少量数据进行网络的自监督训练时,模型仍能取得较好的效果,意味着这个任务本身不需要大规模数据集中富含的复杂语义信息进行建模。  相似文献   

10.
提出一种基于规则的无监督词性标注方法, 利用200多条英语语法规则, 创建26个规则函数, 先将输入的待标注英语句子进行预处理后得到初始标记, 再对每个单词调用规则函数, 最终得到标注后的英语句子. 通过对Brown语料库的实验, 词性标注的正确率达到9395%. 实验结果表明, 本文方法可行、 有效, 能很好地提高英语词性标注的准确率.  相似文献   

11.
为了解决目前医学图像检索领域不能有效缓解“语义鸿沟”的问题,提出基于图理论学习模型的图像自动标注方法.首先讨论了医学图像的标注问题,总结了现有关医学图像标注的研究工作.以胃窥镜图像为具体研究对象,针对图学习模型中的图像-标注词间的关系提取以及图像相似度计算进行了详细分析,并有效地融合进医生的诊断信息作为图像的高级语义特征,更有效地计算出图像间相似度.最后,在Toy data数据集和临床胃窥镜图像集上进行了一系列的实验,结果表明本文方法优越于传统图像标注方法.  相似文献   

12.
图像自动标注是图像检索与图像理解中重要而又极具挑战性的问题.针对现有模型忽略了图像不同区域对图像整体贡献程度的差异性,提出了基于区域空间加权的标注方法,改善了图像的区域特征生成概率估计.此外,针对现有模型未考虑词汇本身重要性以及词汇分布对标注性能的影响,提出了基于词汇固定权值的标注方法、基于平滑词汇频率的标注方法以及基于词汇TF-IDF加权的标注方法,对词汇的生成概率估计部分进行了改进.综合以上区域空间改进与词汇改进,提出了WDVRM图像标注模型.通过在Corel数据库进行的实验,验证了WDVRM模型的有效性.  相似文献   

13.
Web图像不断增加的数量和多样性,使当前图像检索技术面临很大挑战.然而目前图像检索技术还不能满足人们的需要.陈述一种图像内容混合自动注释方法-HIAM,它包含2个工作模块的Web图像检索,其中一个模块是两个级别的图像分类器将图像转换成图像概念的次序;另外一个是图像语义相似处理模块-ISAM,它具备从网页中挑选与图像概念相关的术语作为图像注释.使传统的文本信息检索技术能够用于图像查询的功能.  相似文献   

14.
彩色图像分割中基于图上半监督学习算法研究   总被引:1,自引:1,他引:1  
提出一种新的基于图上半监督学习的彩色图像前景/背景分割模型与算法.该算法的目的是利用人工标定的部分像素点分割信息以实现对整幅图像的分割.通过结合像素点颜色特征和像素点颜色与前景/背景颜色的相似性特征,构造了新的图节点之间的双高斯权重函数,并对此提出自适应的参数选择策略与彩色图像半监督分割的能量模型,通过优化该能量模型将...  相似文献   

15.
大型的、标记密集的数据集是利用大量在线论坛中发现的非结构化数据有效促进文本和图像分析的深度学习方法的创建.虽然这种非结构化数据包比租用的数据注释包花费更低,但它也更容易陷入自然语言应答的陷阱,因为数据的非结构化特性会使回答者可能无法正确回答所提的问题.为了解决这些问题,提出一种深度学习的方法来系统地识别混淆,并从Instagram收集的非结构化数据包注释的数据中提取答案.每个注释数据包含一个图像、一个机器生成的问题和一个非结构化数据包响应.本文使用一个基于Facebook人工智能研究的Pythia体系结构模型:(1)用R-CNN模型来识别突出的特征(自下而上);(2)问题文本用作上下文来衡量这些特征(自上而下).使用基于伯特BERT的分类器来重复训练来自问题和响应的文本特征(不包括图像特征)等任务.结果显示:基于伯特BERT模型(分类AUC-ROC=0.84,应答预测F1=0.77)优于Pythia体系结构(分类AUC-ROC=0.79,应答预测F1=0.46).此外,还提出了一种基于BERT的多任务并行训练模型(1)和(2)能够优于特定任务模型(分类AUC-ROC=0.84,应答预测F1=0.78).  相似文献   

16.
提出基于意见词汇Ontology的Web商品意见属性自动标注模型,以意见词汇为领域,通过对关键技术的研究,构建意见词汇Ontology,建立意见词汇分类体系,设计实现了基于意见词汇Ontology的Web商品意见属性自动标注原型系统.  相似文献   

17.
A large semantic gap exists between content based index retrieval (CBIR) and high-level semantic, additional semantic information should be attached to the images, it refers in three respects including semantic representation model, semantic information building and semantic retrieval techniques. In this paper, we introduce an associated semantic network and an automatic semantic annotation system. In the system, a semantic network model is employed as the semantic representation model, it uses semantic keywords, linguistic ontology and low-level features in semantic similarity calculating. Through several times of users' relevance feedback, semantic network is enriched automatically. To speed up the growth of semantic network and get a balance annotation, semantic seeds and semantic loners are employed especially.  相似文献   

18.
用句子标注图像,建立图像与文本间的跨媒体关联,以提升信息检索准确率,改善用户检索交互体验.利用KDES模型抽取图像特征,在多核学习模型中融合出MK-KDES特征,准确刻画图像视觉特性;设计自然语言生成模型:词序列拼积木,评估单词与图像内容的相关性,优选单词,并根据单词间的语义相关性与句法模式约束,将单词组合成N元词序列;把N元词序列输入模板生成句子.结果表明:MK-KDES-1特征聚焦于图像的纹理及形状视觉特性,它是改善句子BLEU-1评分的关键;而单词间的语义相关性与句法模式约束是提升句子BLEU-2评分的重要前提.   相似文献   

19.
基于流形正则化的在线半监督极限学习机   总被引:1,自引:0,他引:1  
在基于流形正则化的半监督极限学习机(SS-ELM)的基础上,利用分块矩阵的运算法则,提出了在线半监督极限学习机(OSS-ELM)方法.为避免在实时学习的过程中由于数据累积引起的内存不足,通过对SS-ELM的目标函数的流形正则项的近似,给出了OSS-ELM的近似算法OSSELM(buffer).在Abalone数据集上的实验显示,OSS-ELM(buffer)在线学习的累计时间与所处理的样本个数呈线性关系,同时,9个公共数据集上的实验表明,OSS-ELM(buffer)的泛化能力与SS-ELM的泛化能力的相对偏差在1%以下.这些实验结果说明,OSS-ELM(buffer)不仅解决了内存问题,还在基本保持SS-ELM泛化能力的基础上大幅度提高了在线学习速度,可以有效应用于在线半监督学习当中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号