首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
许多社交网站和图片分享网站允许用户自由地选择标签,来对他们上传的图片进行标注.这极大地方便了图片检索、图片排序、标签推荐等多媒体应用.然而,用户提供给网络图片的标签常常具有不相关、不精确、不完整的特点,因而需要对其进行精化.提出一种基于多元特征融合和多元关系一致性的社会标签精化模型.该最优化模型综合考虑了图像视觉特征、用户标签、图像用户信息以及它们之间的关系,并以这三者的一致性关系作为规划目标.此外,在图像视觉特征处理方面,将多元特征融合在最优化模型中,通过迭代算法自动地给出各个特征的权重.与传统的将多个底层视觉特征连接成一个长的特征向量或者仅使用一种特征的做法相比,该方法不但有效避免了维度灾难,还能最大程度地利用不同的视觉信息用于图像区分.实验表明,该方法与目前提出的一些最优秀算法具有可比性.  相似文献   

2.
为了实现对传统民族服饰图像文化内涵的自动挖掘,提出了基于字典学习的传统民族服饰图像多标签标注算法.该算法在原有相似系数结构不相关字典学习方法基础上,对重建系数判别能力进一步增强,实现多标签标注任务.首先,利用支持向量机(SVM)算法对重建系数进行线性分类;接着,为每一类别构建一个字典,同时对SVM分类错误的样本进行惩罚;然后,将字典与重建系数不断迭代求解;最后,利用测试样本重建误差和重建系数在分类器中的分类效果完成标签预测.实验结果证明了该方法性能上有所提升,并且在不同数据上的结果更加稳定.  相似文献   

3.
针对现有盲图像质量评价只关注图像局部或全局特征,且难以有效聚合特征等问题,提出了一种基于多层级信息稀疏表征的评价方法.首先,利用合成失真技术构建大规模数据集;然后,在原始图像上提取图像块作为初级视觉信息建立局部描述子集,同时通过卷积神经网络提取高级语义信息建立全局描述子集,在此基础上利用稀疏编码进行无监督学习训练,得到局部描述子码本和全局描述子码本;最后,汇聚目标数据集训练样本在两类码本上的稀疏编码系数作为图像表征,结合已有标签训练支撑向量回归(SVR)模型以预测图像质量.在LIVE,CSIQ和TID2013单个数据库上的实验结果表明:所提算法具有较强的主客观一致性,整体性能优于其他先进方法.研究结果表明本文算法具有较强的泛化能力和攻防竞争力,有益于图像质量评价任务的广泛应用.  相似文献   

4.
图像语义标签的自动标注技术是当前信息检索领域的热点问题.图像标注本质上是一个机器学习问题,即如何根据图像的视觉内容推导图像的语义标签.综述了图像标注的发展和现状,并对目前比较流行的图像标注算法进行深入的讨论和比较研究.最后提出一种目前较新且值得深入研究的基于稀疏编码的图像标注算法.  相似文献   

5.
提出一种基于视觉内容语义相关度的图像标签自动排序方法.该方法按照标签与图像内容的语义相关程度对网络共享图像的标签进行排序.首先,算法基于贝叶斯理论给出标签与图像内容语义相关度计算的概率表述.然后,融合多种视觉特征以实现对不同语义的标签与图像内容相关度概率的准确估计,具有较高的可扩展性.实验数据采用149 915幅Flickr网站下载图像,实验结果验证了本文方法的有效性.  相似文献   

6.
一个基于多视图立体视觉的三维重建方法   总被引:1,自引:0,他引:1  
研究了基于多视图立体视觉的三维重建方法.给定一组待重建物体的图像,利用传统的立体视觉技术计算每幅图像的深度信息;然后设计一个基于体素划分的模型融合方法,将图像的深度信息融合为一个完整的三维初始模型;随后,对初始模型进行全局的迭代优化,输出最终的重建模型.在构造体素网络图时,充分利用图像一致性度量建立体素之间的连接关系;在对模型迭代优化时,结合图像一致性度量和网格的光顺性准则.该方法能很好地处理纹理缺失的区域,获得完整的三维模型.实验结果证明:该方法能够重建高质量完整的三维模型.  相似文献   

7.
为了将标签间的语义相关性引入多标签图像分类模型中,传统的方法例如 ML-GCN 通过设置单阈值将标 签条件概率矩阵二值化为标签共现矩阵,然而,仅设置单阈值很难归纳所有的标签语义关系情况。 针对这一问题, 提出一种融合标签间强相关性的多标签图像分类方法—MGAN(Multiple Graph Convolutional Attention Networks), 通过设置多个阈值,将传统的标签条件概率矩阵按照不同的相关性程度分割为多个子图;同时,为了提升多标签分 类性能,也引入图像区域空间相关性。 另外,针对传统的“CNN+GCN”方法将标签与特征的融合张量视为预测分数 缺乏可解释性问题,将标签与特征的融合张量视为注意力分数;在 MS-COCO 和 PASCAL VOC 数据集上与其他主 流多标签图像分类方法进行了对比实验,平均准确率分别达到了 94. 9%和 83. 7%,相较于经典 ML-GCN 模型,分 别获得了 0. 9%和 0. 8%准确率提升,且在“Binary”和“Re-weighted”邻接矩阵模式下,MGAN 都有较好的表现,验证 了新的融合方法可以缓解图卷积神经网络过平滑问题对多标签图像分类的影响。  相似文献   

8.
图像自动标注是图像理解与模式识别等领域中具有挑战性的关键研究问题.目前图像自动标注领域存在着一些问题,如未标注数据规模要远大于标注数据规模,只能单独使用某种图像分割策略与某类图像表示方法.针对上述问题,提出了基于Co-training的图像自动标注方法,通过构建4个独立的特征属性进而建立4个子分类器,将不同的图像分割方法与特征表示方法整合到一个统一框架中,利用提出的基于投票与一致性相结合的自适应算法扩展原始训练集.该方法通过使用Co-training算法,利用大量未标注数据来提升图像自动标注的性能.通过在Corel 5K数据库上进行实验,验证了提出方法的有效性.  相似文献   

9.
为解决多标签线性判别分析(MLDA)方法在非线性维数约简方面的局限性,提出了一种多标签核判别分析(MKDA)方法,并将其用于人脸的身份与性别识别中.该方法的基本思想是通过非线性映射将训练样本从输入空间映射到高维核特征空间中,并在该特征空间中进行基于MLDA的数据降维.在身份和性别识别中,首先采用MKDA方法对人脸图像特征向量进行降维,获取判别特征矢量集;其次,为每幅人脸图像赋予一个表征身份和性别的多标签类别矢量;最后,采用减秩回归模型(RRR)描述判别特征矢量与多标签类别矢量之间的回归关系,并利用该模型进行未知人脸的身份和性别识别.AR人脸数据库上的实验结果表明:在人脸身份和性别识别中,MKDA方法的识别率高于传统核判别分析(KDA)方法.  相似文献   

10.
传统的视觉分类方法普遍忽视了多标签间的相关性和大量相关源数据的判别信息.为此,基于共享子空间和领域适应学习方法,针对多标签视觉分类问题,提出了一种新的联合子空间和多源适应学习的多标签视觉分类方法,简称为多源适应多标签学习(Multi-Source adaptation Multi-Label learning,MSML).MSML将综合考虑多标签相关性、灵活的特征相似性嵌入和多源模型的适应学习等目标,并将其融为一个统一的学习模型,其全局最优解只需通过一个广义特征分解问题的求解便可获得.在视频概念识别、自动图像标注等实际应用中进行比较分析,结果显示了本文方法的有效性和优越性.  相似文献   

11.
高分辨率遥感影像在实际应用中得到广泛使用。高分影像语义分割方法的研究具有重要实际应用价值。近来基于深度卷积网络的遥感影像标注方法表现出了比传统方法更为优越的性能;然而由于其基于固定感受野大小的上下文信息获取方法没有显式利用像素间约束关系,导致同一地物内部语义标注结果不一致。基于同一区域内部像素属于相同类别概率较大的假定,试图引入图像区域内部语义标注一致性约束,以改善现有深度卷积神经网络描述上下文信息的能力。在现有全卷积网络模型基础上,利用卷积神经网络最后一层特征,引入一个表示区域内部像素特征一致性的损失函数;将该损失函数与softmax损失函数进行联合训练,得到网络模型参数。在ISPRS(国际摄影测量与遥感学会)的Vaihingen 2D语义标注数据集上,对提出的方法进行了实验验证,实验结果表明所提方法在大多数类别上取得了较现有卷积神经网络模型更优的分类结果,总体准确率达85.18%。提出的引入区域内部像素标记一致性的全卷积网络模型,可以有效捕捉区域内部像素特征一致性的上下文信息,能有效纠正全卷积网络模型在区域内部像素分类中的冲突,获得区域一致较好的分类结果,从而改善图像的语义标注效果。  相似文献   

12.
为了解决设计重用过程中基于模型的产品数字化定义(MBD)模型的问题,采用特征识别技术,对MBD模型自动添加语义标注,从而提高关键字检索的准确性.首先,对MBD模型的构成原理与模型要素进行分析,并在融合关键信息的基础上建立零件模型的属性面邻接图(AAG),根据零件模型上加工特征,将特征划分为螺钉头部特征、螺钉功能特征和材料特征.其次,通过顶点属性结合邻接矩阵重构图的顶点序列,动态编码结合距离匹配,求出最大公共子图,得出MBD模型之间的相似度.最后,利用聚类法实现对MBD模型的自动语义标注.实验结果表明:文中方法可以实现MBD模型的自动语义标注,很大程度上提高语义标注的自动化程度.  相似文献   

13.
针对Ada Boost算法训练分类器的特征具有大量冗余问题,提出了一种融合特征选择的Ada Boost集成算法.首先,使用一种特征选取方法,选择图像特征之间冗余度最小的特征,构造最优训练集;其次,采用Ada Boost算法训练分类器,构建分类模型;最后,使用分类模型实现待标注图像的自动标注.实验使用华盛顿大学用于图像自动标注的数据集,结果验证算法的有效性,并且相比其他传统算法,该算法具有更高的分类精度.  相似文献   

14.
通信链路层特征盲识别是智能通信和通信对抗领域关键技术。为提高基于IEEE 802.11协议的无线(局域)网/无线保真(wireless fidelity,Wi-Fi)信号的编码参数盲识别精度,提出了一种基于深度学习的低密度奇偶校验码(low density parity check code,LDPC)编码参数盲识别算法,可准确盲识别信道编码算法的信息位码长和码率。算法以解调后的比特流为训练数据集,搭建多层深度神经网络模型,经过多次调参和迁移训练,最终得到了能够准确预测编码参数的网络模型。实验结果表明,该网络模型能够在高达10%误码条件下得到优于91%的编码参数盲预测率,在无误码的条件下,编码参数盲预测准确度高达95.32%,为智能通信和通信对抗的研究提供了一定参考价值。  相似文献   

15.
提出了一种全新的基于视觉显著度和上下文稀疏分解的图像超分辨率算法。利用人眼视觉感知显著的区域往往趋向于高度结构化的特性,字典学习和稀疏分解过程中可以捕获更多细节特征。在字典学习部分,视觉显著区域提取出的图像样本用来训练显著字典。在先验模型的部分,由于视觉显著区域通常趋于高度结构化,基于上下文的稀疏分解被用来进一步探索相邻图像块之间的联系。实验结果表明,所提出的方法在性能上优于其他最新的方法,峰值信噪比(PSNR)增益最大。主观结果也显示,所提出的方法可以有效减少假影现象,并保持更多细节。  相似文献   

16.
为了提高图像显著性检测的准确性,从数学模型上探索显著性的多特征空间.利用多尺度特征提取算法获得低层视觉特征,对特征矩阵用低秩矩阵恢复理论提取显著图,并在自底向上模型基础上融合了高层视觉特征,由高层视觉特征构成一幅权重的显著图.提高了显著度和显著目标的检测性能.通过自适应阈值算法对视觉显著目标进行分割.实验结果表明,该模型比传统的模型提取的显著目标更完整、更准确.  相似文献   

17.
针对利用远程监督标注文本实体过程中存在实体类别标注错误问题导致模型难以有效区分各实体的类别特征,影响模型精准度的问题,本文提出一种利用原型网络过滤训练语料中标注错误样本的远程监督命名实体识别方法,利用预训练的原型网络编码正确标注实体生成类别原型表示,过滤语料中距类别原型较远的样本.实验表明,使用原型网络有效地提高了语料的标注质量,提升了模型性能.  相似文献   

18.
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。  相似文献   

19.
电信客户信用风险等级评估是对电信客户的信用风险进行等级分类. 针对建立客户信用风险等级分类模型时,大量带有类标注数据难以获得的问题,提出了基于主动学习的分类器建模方法,并对基于QBC(委员会投票选择)的主动学习算法进行改进以提高分类器的预测精度. 通过对实际电信客户数据进行信用风险等级建模实验,结果表明:应用新算法,分类器使用了较少的带类标签样本数据,达到了与被动学习相同的精度,大大降低了信用专家评估数据的工作量.  相似文献   

20.
提出一种基于组稀疏卡尔曼滤波的机动轨迹多步预测方法。首先引入组稀疏编码,通过一次学习建立简单的多步线性回归预测模型,克服了传统方法未能充分利用历史数据而导致预测精度降低的问题;再利用最小角回归算法来计算该模型的稀疏系数,进一步改善模型系数估计的准确性;然后改进了卡尔曼滤波算法,并结合上述组稀疏编码算法,来确保预测结果的精确性;最后通过与传统BP、长短时记忆网络和组稀疏编码方法的仿真比较,验证了所提方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号