首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于支持向量机语义分类的两种图像检索方法   总被引:2,自引:0,他引:2  
为了更好的解决基于内容的图像检索问题,提出了2种基于语义的图像检索方法.第1种是基于支持向量机(SVM)语义分类的图像检索方法.该方法首先提取训练图像库的底层特征信息,然后利用SVM对所提取的特征进行训练,构造多分类器.在此基础上,利用分类器对测试图像自动分类,得到图像属于各个类别的概率,实现图像检索.第2种是利用图像自动标注方法进行检索.在基于语义的图像自动标注中,先对训练集进行人工标注,对测试图像利用SVM分类器进行分类,并找到与该图像最相似的N张构成图像集,对该图像集的标注进行统计,找到关键词,从而提供概念化的图像标注以用于检索.通过在标准图像检索库和自建图像库上的实验结果表明,以上2种基于语义的图像检索方法是高效的.  相似文献   

2.
图像自动标注是图像理解与模式识别等领域中具有挑战性的关键研究问题.目前图像自动标注领域存在着一些问题,如未标注数据规模要远大于标注数据规模,只能单独使用某种图像分割策略与某类图像表示方法.针对上述问题,提出了基于Co-training的图像自动标注方法,通过构建4个独立的特征属性进而建立4个子分类器,将不同的图像分割方法与特征表示方法整合到一个统一框架中,利用提出的基于投票与一致性相结合的自适应算法扩展原始训练集.该方法通过使用Co-training算法,利用大量未标注数据来提升图像自动标注的性能.通过在Corel 5K数据库上进行实验,验证了提出方法的有效性.  相似文献   

3.
典型相关分析与多伯努利相关模型的图像标注   总被引:1,自引:0,他引:1  
文章提出一种基于图像的视觉词袋与文本标注的典型相关分析与分割无关的多伯努利相关模型的自动图像标注算法。在图像标注与分类任务中,矢量量化图像局部描述子得到的视觉词袋特征已显示了其鲁棒性与可区分性,文中对视觉词袋与文本特征作典型相关分析,确保投影变换后新的视觉特征与文本特征的相关性最大化,从而有效地在视觉与文本2种模态中建立联系,契合了自动图像标注的主旨。文中还提出了一种简化的多伯努利相关模型,实验结果证明了典型相关分析比概率潜藏语义分析更适合于图像自动标注,也证明了简化的多伯努利相关模型的有效性。  相似文献   

4.
针对垃圾短信过滤问题,提出了一种亚文档集成学习方法.该方法采用亚文档集成学习框架将短文本在线二值分类问题转化成若干个子分类问题,并通过线性组合多个子问题的分类结果得出最终的分类预测.利用基于串频索引的文本分类算法实现了一种有效的弱分类器.实验数据表明亚文档集成学习框架能够提高现有文本分类算法的效能,而在亚文档集成学习框架下,基于串频索引的弱分类器过滤效果最佳.  相似文献   

5.
为解决弱情感倾向语料影响文本情感分类的问题,提出基于全局语义学习的文本情感增强方法。首先设计语料划分方法,将语料划分为强情感倾向语料与弱情感倾向语料,然后,从文本处理全过程及整体语义学习的角度出发,构造均值抽取与最大值抽取的语义提取方式及文档信息向量,改进基于循环神经网络的变分自编码器的语义学习过程,并用于学习强情感倾向语料中文本的词语序列特征与语义特征。基于此,对弱情感倾向语料进行重构,实现情感增强目标,最后,将经过情感增强的语料替换掉原来的弱情感倾向语料,再进行情感分类模型的训练与测试。结果表明:提出的文本情感增强方法能够提升情感分类效果,并使得Bert分类器对IMDb影评数据集的情感分类精确率达到了93.03%。  相似文献   

6.
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记. 该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记. 为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验. 为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-NewsGroup)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验. 实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率.  相似文献   

7.
在对图像中的主要描述物体进行检测或者对图像进行分类时需要利用多种不同类型的图像特征,例如HoG、BoW等.从多模态学习的角度来说就是需要对多种不同通道的特征加以利用.虽然将多种特征协同使用可以提升图像中物体检测或者图像分类的性能,但提取多种模态特征需要使耗费大量时间,难以满足实时性要求较高的环境(移动设备,网络搜索等)的要求.本文提出在训练阶段利用强模态的特征来辅助较弱的模态进行学习,通过让弱模态的分类器能够在大量的未标注样本上取得和强模态一致的效果,从而增强弱模态分类器的泛化性能;同时在测试阶段,只需提取弱模态特征,就可以利用使用弱模态特征的分类器进行预测,并达到较好的效果.在INRIA person和caltech101数据上的实验表明,本文的方法在测试时由于只使用了相对抽取开销小的弱模态特征,从而可以应用在实时性要求较高的环境,同时还带来了泛化性能的提升.  相似文献   

8.
研究大规模海洋遥感影像管理的关键是缩小影像低层视觉特征与高层语义之间的鸿沟.针对海洋遥感影像中不同区域对语义相似性度量的贡献程度不同,提出一种基于深度信念网络多示例(deep belief networks multi-instance,DBNMI)的遥感影像语义自动标注模型.模型对初始输入遥感影像进行自适应分割,粗粒度划分海洋遥感影像背景区域和对象区域;对影像对象区域的低层视觉特征和高层语义概念间关系,利用深度信念网络模型进行自动建模;定量计算标注词间共现和对立的语义关系,改善图像标注结果.在公开遥感影像数据集上进行验证,实验表明所提出方法在标注精度上取得了较好效果.  相似文献   

9.
网页分类技术   总被引:17,自引:0,他引:17  
网页分类是使用机器学习的方法实现网页类别的自动标注.回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法.使用纯文本分类技术处理网页是不合理的.基于概率模型的方法和关系学习方法计算量大,关系学习方法学习结果的可解释性好,支持向量机方法分类准确率高,但核函数的构造和大规模数据集的训练都是该算法的难题.应该采用多种指标对网页分类算法进行评价.  相似文献   

10.
针对Ada Boost算法训练分类器的特征具有大量冗余问题,提出了一种融合特征选择的Ada Boost集成算法.首先,使用一种特征选取方法,选择图像特征之间冗余度最小的特征,构造最优训练集;其次,采用Ada Boost算法训练分类器,构建分类模型;最后,使用分类模型实现待标注图像的自动标注.实验使用华盛顿大学用于图像自动标注的数据集,结果验证算法的有效性,并且相比其他传统算法,该算法具有更高的分类精度.  相似文献   

11.
基于相关反馈的文物图像语义标注   总被引:1,自引:0,他引:1  
目的 通过研究基于相关反馈的文物图像语义标注问题,以克服图像检索领域内的"语义鸿沟".方法 在标注过程中介入人机交互,以此来改进标注的准确率与效率.算法首先通过相关反馈构建语义相似性矩阵,进而通过语义聚类实现语义标注.结果 在对文物图像的标注试验中,获得了较好的标注准确率与效率.结论 基于相关反馈的图像语义标注较自动语义标注具有更大优势.  相似文献   

12.
提出了一种基于Vague融合的自动图像标注方法,通过有效区域匹配方式,利用近邻语义信息来平衡正负样本数目,并且首次利用Vague集的真假隶属度融合图像的区域信息,从而获得更准确的标注结果.实验结果表明,该标注方法是可行的,同时,与传统的标注方法相比,标注结果得到了明显的提高.  相似文献   

13.
针对CVE字典缺少分类和归纳能力,无法为多重系统漏洞设计有效防御策略的局限,提出了CVE分类器的CVE漏洞分类框架.该CVE分类器根据不同的分类特征对CVE进行分类,在支持向量机的帮助下,CVE分类器自动地从相关的漏洞数据库(包括BID,X-Force和Secunia)中抽取训练数据,并基于该训练数据为分类特征建立学习模型.  相似文献   

14.
哈希算法结合卷积神经网络是一种常用的有效图像检索方法,这种有监督的学习方式要求大量人工标注的标签,耗费巨额的人力成本,且这种标签具有较强的专家制定性,在图像深层次语义的挖掘上能力有限。针对这一问题,该文提出了基于弱监督(Weakly-supervised)深度卷积神经网络的哈希函数框架,该框架包括弱监督的预训练和有监督的微调两个阶段。通过利用弱监督标签信息来学习语义感知哈希函数,将标签表示为语义词向量。根据语义间的相似与否来训练网络,设计的目标函数可以使语义相似的图像间的汉明距离较小,语义不相似的汉明距离相对较远。实验结果表明,该文提出的图像检索方法与目前先进的图像检索方法相比,精度提高了2%~6%。  相似文献   

15.
针对图像检索中存在的“语义鸿沟”问题,本文提出一种语义学习模型进行图像的自动标注.首先提出连续的概率潜在语义分析(PLSA)模型及对应的参数估计算法,并利用最大惩罚似然的方法解决协方差矩阵的奇异性问题;然后,提出一个根据不同模态数据各自的特点进行处理的概率模型,该模型使用连续PLSA和传统PLSA分别建模视觉特征和文本关键词,并通过不对称学习算法发现两种模态之间共有的语义主题,从而能更精确地对未知图像进行标注.通过在分别包含5 000幅和31 695幅图像的两个标准Corel数据集上进行实验,并与几种典型的图像标注方法进行比较的结果表明,文中方法具有更高的精度和更好的效果.  相似文献   

16.
提出构建基于语义分析的微博搜索以帮助用户从海量的、书写通常不规范的微博中有效地获取信息。和现有的微博搜索引擎不同,基于语义分析的微博搜索利用一系列的自然语言处理和文本挖掘模块从微博中获取各类兴趣点,例如命名实体、事件、情感等。这些兴趣点进一步被索引,以支持分类浏览和高级搜索。本文讨论了微博语义搜索所面临的挑战及对策,介绍了一种参考实现框架及相关的语义分析技术,特别是面向微博的语义角色标注技术。  相似文献   

17.
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义模式的半监督中文观点句识别方法,可以通过小规模语料的训练识别出中文观点句.首先,通过语义模型提取算法从训练集当中识别出观点句语义模型和非观点句语义模型;然后,将两种模型转化为语义特征,并且加入词汇特征和词性特征两方面特征,通过BootStrapping对小规模标注语料进行训练,得到朴素贝叶斯分类器;接着,使用朴素贝叶斯分类器对大规模未标注的语料进行分类,将可信度高的样本加入训练模型迭代进行训练,直到无样本加入;最后经过多轮迭代得到最终的分类器.实验表明,该方法在只具备少量样本的情况下就可达到83.7%的准确性,证明了该方法的有效性.  相似文献   

18.
零样本学习是一类特殊的图像分类问题,是指测试数据的类别在训练数据中没有出现的情况.为了更好地描述语义特征空间中图像特征和语义特征的距离关系,本文将距离度量学习引入零样本学习任务.具体而言,首先利用典型相关分析将样本的图像特征和相应类别的语义特征映射至公共特征空间;然后,利用距离度量学习衡量图像特征和语义特征之间的距离;最后,使用最近邻分类器进行分类.通过在流行的Aw A和CUB数据集中的实验,证明了所提方法的有效性和鲁棒性.  相似文献   

19.
针对当前图像语义标签的无序性问题,提出了一种基于基分类器加权投票的图像语义标签自动排序方法 ISLR-BV。该方法综合考虑图像的显著性区域内容以及图像的语义上下文信息,借助RAPC-W进行多标签数据集的转化,并在RAPC-W转化后的数据集上进行基分类器的学习,借助得到的基分类器对图像的语义标签进行加权投票,以此来决定每个语义标签与图像的相关程度,实现图像语义标签的有序排列。在数据库NUS-WIDE上的实验结果表明,在一定程度上提高了图像语义标签排序的准确度。  相似文献   

20.
面对图像迅速增长的局面和用户检索图像的要求,依靠先进的技术提取图像蕴含的情感语义并对其分类正是当前各行业急需解决的问题.为此,以自然风景图像为例,提出了一种基于Adaboost-BP神经网络的图像情感语义分类方法,通过OCC情感模型描述图像的情感,使用Adaboost算法组合15个BP神经网络弱分类器的输出,构建强分类器,旨在提高图像情感语义分类的效率.使用百度图片频道上下载的600张自然风景图像进行训练和测试,实验通过与BP神经网络方法测试结果相比较,取得了良好的分类效果,可为更多类型的图像情感自动分类打好基础,具有一定的实用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号