首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
提出了一种基于隐条件随机场的人体行为识别方法。首先,通过目标检测和目标跟踪提取图像序列中人体所在时空区域;其次,提取人体区域的 Gist 特征作为人体行为视觉描述子;最后,利用隐条件随机场模型对人体行为进行建模和识别。通过大规模试验证明了该方法的有效性,与其他方法的对比实验验证了该方法的优越性。  相似文献   

2.
针对传统“视觉词袋模型”在进行场景分类时只利用图像的特征域,忽略其空间域中上下文语义信息的问题,提出一种基于图像上下文语义信息的场景分类方法.在传统“视觉词袋模型”的基础上,引入马尔科夫随机场模型对图像上下文语义信息进行建模,利用潜在的狄利克雷分布学习场景的主题分布,且利用支持向量机构造场景分类器.对16类场景的分类实验证明该方法能够有效提高分类精确度  相似文献   

3.
针对道路检测采用图像外观特征对像素或区域进行分类,容易受到光照、阴影和遮挡等复杂因素的影响导致检测精度低的问题,提出一种结合场景结构信息和全连接条件随机场(CRF)模型的道路检测方法.首先检测道路消失点和道路边界线并生成道路的置信图;然后基于图像超像素训练场景结构布局模型得到结构布局的估计;融合置信度图、结构布局图和图像外观特征构建基于像素的全连接CRF模型;最后通过CRF模型推理得到分类结果.实验对比结果表明:采用结构信息和全连接CRF能够有效提高道路检测的精度,对阴影和遮挡等复杂道路环境具有鲁棒性.  相似文献   

4.
用于图像分割的局部区域能量最小化算法   总被引:3,自引:0,他引:3  
针对点对马尔可夫随机场(Pairwise MRF)模型中像素成对交互的结构不能充分描述图像丰富的局部统计特征问题,在研究Pairwise MRF模型基础上,提出了一种基于局部区域能量最小化的图像分割算法.该算法先利用图像局部区域信息构造局部区域能量模型,建立了一种局部交互的区域马尔可夫随机场分割模型,然后采用无环置信传播(LBP)算法对MRF全局能量进行优化.优化过程中,对局部区域能量进行收敛并按照MAP准则估计局部区域标号,通过LBP算法把局部区域信息传递到邻域区域中去.实验结果表明,所提出的新算法较标准LBP算法具有更好的分割结果,并有效地抑制了图像噪声信号和纹理信号对分割结果的干扰和影响.  相似文献   

5.
基于条件随机场的中文科研论文信息抽取   总被引:2,自引:1,他引:1  
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型参数估计和特征选择.实验中采用L-BFGS算法学习模型参数,并选择局部、版面、词典和状态转移4类特征作为模型特征集.在信息抽取时先利用分隔符、特定标识符等格式信息对文本进行分块,在分块基础上用条件随机场进行指定域的抽取.实验表明,该方法抽取性能明显优于基于隐马尔可夫模型的方法,且加入不同的特征集对抽取性能提升作用不同.  相似文献   

6.
研究基于Haar-CNN模型的图像特征提取用于自然场景图像分类的问题.Haar小波变换是图像处理中常见的一种变换,可以提取图像的局部和空间信息,并把彩色图像的颜色、轮廓和纹理信息进行分层次的表达.卷积神经网络(CNN)是一种得到广泛研究与应用的深度学习模型,对图像特征具有很好的表达能力.基于Haar小波变换和CNN模型的优势,提出一种新的图像特征提取方法,即Haar-CNN模型;利用该模型提取得到图像更丰富的特征信息;然后比较基于Haar-CNN和CNN模型提取的自然场景图像特征在分类中的效果,探究Haar-CNN模型对于自然场景图像特征提取的优势.再对比在不同颜色空间上Haar-CNN模型对自然场景图像的分类效果,实验结果表明YCb Cr颜色空间上的分类精度最高,为96.2%,比灰度图像的分类精度提高了7.8%.同时,进一步分析Haar-CNN模型中图像块大小、隐藏层神经元个数、池化区域大小、模型深度等参数对图像分类精度的影响,实验结果表明参数选择对图像分类很重要,合适的参数选择可以提高分类精度.  相似文献   

7.
针对全局同态先验马尔可夫随机场(Markov random field,MRF)模型在图像分割中不能有效利用图像局部统计特征的问题,提出了一种基于局部自适应先验MRF模型的图像分割算法.该算法基于贝叶斯理论,利用局部先验Potts模型描述图像的局部特征,建立了一种局部自适应先验MRF模型;提出了基于区域的置信度传播(Belief Propagation,BP)算法,把图像的局部区域特征传递到全局,最终基于最大后验准则(MAP)得到图像的分割结果.实验结果表明:所提模型对于图像中的噪声或者纹理特征等具有较好的分割,分割结果明显优于全局同态先验MRF模型;提出的自适应先验MRF模型对于图像的噪声或者纹理突变信号的干扰具有较强的鲁棒性;算法具有较少的迭代次数和较好的分割结果,且分割时间较短.  相似文献   

8.
针对中智C-均值聚类算法抗噪能力弱的问题,提出基于隐马尔科夫随机场的半监督中智聚类分割算法.利用隐马尔科夫随机场模型的先验信息描述图像像素邻域关系,将其与隶属度相结合作为监督因子,嵌入现有中智聚类并构造半监督中智聚类目标函数;将欧式空间样本通过非线性变换用核函数映射至高维特征空间,增强图像的抗干扰能力;最后采用最优化方法获得隐马尔科夫随机场的半监督核空间中智聚类分割的迭代表达式.对灰度图像添加高斯和椒盐噪声进行分割测试,以验证算法性能.测试结果表明:所建立的分割算法相比基于隐马尔科夫随机场的模糊C-均值聚类等分割算法的抗噪性能有了显著提高.  相似文献   

9.
[目的]研究无监督词性标注模型在低资源语言上的性能表现.[方法]尝试利用无监督词性标注模型,包括高斯隐马尔科夫模型(Gaussian HMM,GHMM)、最大化互信息模型(mutual information maximization, MIM)与条件随机场自编码器(conditional random filed autoencoder, CRF-AE),展开低资源词性标注实验.基于对前人工作的凝练,在英文宾州树库上设置了少样本和词典标注两种低资源场景.[结果]无监督词性标注模型能够在少样本场景中超越条件随机场模型,但在词典标注场景中却始终逊色于条件随机场模型.[结论]无监督损失更加擅长对高频词进行建模,使得模型在少样本场景下获得更好的性能表现;同时无监督损失倾向于生成更加均匀的词性分布,从而降低模型在词典标注场景下的性能.  相似文献   

10.
针对现有方法难以解决复杂场景图像分类的问题,本文提出一种基于局部语义上下文的场景分类方法。该方法将整个图像分割为一系列超像素,从超像素提取局部特征表示图像的局部观察;在观察图像和场景类别标签之间引入表示超像素区域语义的随机变量,通过不同随机变量之间的依赖关系引入局部语义上下文信息,较好地描述了图像观察、图像内容与场景类别标签之间的语义关联度,最后定义判别图像场景类别的目标函数,采用优化方法推断图像的场景类别。在标准图像库进行的实验证明了该方法的有效性。  相似文献   

11.
12.
作为图像局部特征区域的有效描述方法,局部二值模式是目前对二维图像最有效的纹理分析特征之一。本文提出了基于局部二值模式特征的稀疏表示人耳识别方法。该识别算法首先提取训练人耳图像的局部二值模式特征描述子作为稀疏表示的字典,然后将测试样本的局部二值模式特征描述子表示为字典中所有局部二值模式原子的稀疏线性组合,最后通过求解稀疏表示模型得到稀疏编码系数,根据测试人耳图像的重建误差进行识别。在UND-J2人耳库和USTB人耳库上的实验结果表明,基于局部二值模式特征的稀疏表示人耳识别方法对人耳图像光照变化、姿态变化以及人耳遮挡具有更好的鲁棒性,实现了更高的识别率。  相似文献   

13.
The performance of scene classification of satellite images strongly relies on the discriminative power of the low-level and mid-level feature representation. This paper presents a novel approach, named multi-level max-margin analysis(M3DA) for semantic classification for high-resolution satellite images. In our M3 DA model, the maximum entropy discrimination latent Dirichlet allocation(Med LDA) model is applied to learn the topic-level features first, and then based on a bag-of-words representation of low-level local image features, the large margin nearest neighbor(LMNN) classifier is used to optimize a multiple soft label composed of word-level features(generated by SVM classifier) and topic-level features. The categorization performances on 21-class land-use dataset have demonstrated that the proposed model in multi-level max-margin scheme can distinguish different categories of land-use scenes reasonably.  相似文献   

14.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

15.
为解决算法生成纹理地图时时间耗费量大的问题,提出采用KD-tree算法对数据结构进行划分、减小KNN算法搜索复杂度、提高搜索速度的方法.针对基于纹理基元的分类算法无法准确检测室外某些纹理相似性较高的自然场景,提出加入颜色特征、设置相应权值构建混合模型的方法.实验结果表明,基于KD-tree的KNN算法可缩短分类时间、满足实时性的要求,基于纹理基元与颜色的分类算法在室外自然场景中能够获得较高的分类精确度.  相似文献   

16.
基于综合特征的Bp_adaboost工业仪表图像分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对工业场景图像背景复杂,受多种因素影响、利用单个特征完成工业仪表图像分类不能达到满意效果的问题,提出了一种综合利用图像的颜色和纹理特征,通过Bp_adaboost的方法对工业仪表图像进行分类的方法。首先基于HSV空间进行低阶颜色矩特征提取;然后基于灰度共生矩阵进行纹理特征提取;最后用17维综合特征向量对工业仪表图像进行Bp_adaboost分类学习和测试。实验结果表明,该方法对液位控制系统工业仪表与液位容器设备图像能取得较好的分类结果。  相似文献   

17.
为满足机器人伺服抓取中定位精度和实时性的要求, 提出一种基于Harris及改进局部二值模式(LBP)的特征匹配和目标定位快速算法. 首先采用Harris检测算法提取图像特征点; 然后提出一种新的特征点描述子定义方法, 先利用胡矩确定特征方向, 再根据特征方向对局部图像做标准化处理, 提取标准化局部图像LBP特征作为特征点描述子; 最后通过计算两张图像中各特征点描述子间的汉明距离实现特征匹配, 再根据匹配结果估计单应性矩阵, 定位目标在场景图像中的位置. 实验结果表明, 该算法匹配速度快、 定位精度高.  相似文献   

18.
针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,加快模型收敛的同时也提升了分类精度。此外在网络中嵌入多尺度SE block模块对通道特征进行重校准,提取出更加重要的特征信息,进一步提升了网络的分类性能。在AID和UCMerced_Land Use两个公开数据集上的分类精度分别为91.92%和93.52%,相比常规残差网络分类精度分别提高了3.38%和10.24%,证明所提方法在遥感图像场景分类任务中的可行性和有效性。  相似文献   

19.
医学图像分割是临床诊断的关键环节,分割结果将直接关系到后续对病灶的识别。C-V模型(Chan-Vese)大量应用于各种医学图像分割过程。围绕肝脏超声图像,针对传统C-V模型依赖初始轮廓及运算复杂耗时的特点,融合随机森林方法,提出一种基于边缘引导能量函数和局部约束特征的分割方法,利用随机森林节点生长和分类速度快的优势,在粗分割的基础上形成无需初始化的C-V模型,而后借助分类特征得到精准的肝脏区域及病灶分割结果。实验证明,经过优化的改进方法是可行有效的,对于图像中的组织和病灶区域能有效分割和提取  相似文献   

20.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号