共查询到15条相似文献,搜索用时 742 毫秒
1.
2.
自然场景中文本检测易受光照、复杂背景、多语言文字、字体及尺寸等因素影响,该文提出了一种基于Itti视觉关注模型与多尺度最大稳定极值区域(maximally stable extremalregion,MSER)结合的自然场景文本检测算法.首先利用改进的Itti视觉关注模型提取文本特征图,并采用不同结合策略得到各尺度文本显著图;然后结合多尺度的MSER区域得到3种文本候选区域.根据文字与生成文本框的几何规则合并文本候选区域得到文本行;最后利用随机森林分类器除去非文本区域得到最终文本区域.实验结果表明,该方法对于自然场景图像中的文本检测具有较高的精确度和一定的鲁棒性. 相似文献
3.
结合对比特性与局部清晰特性的图像显著区域检测 总被引:1,自引:1,他引:0
为了有效地确定图像中的重要区域,文中根据人眼视觉关注中自上而下和自下而上的两种特点,提出了一种结合图像对比特性与清晰区域的显著检测方法. 图像中颜色的全局和局部对比引起低级视觉关注,而图像的清晰部分通常对应于拍摄时所关注的对象,反映高级视觉特性. 采用颜色分类和检测图像细节区域的方法分别提取了两类显著图,并将它们组合起来. 实验结果表明,通过综合考虑两种视觉特性得到的显著图,对多类图像都能较好地检测出与人眼视觉关注相吻合的区域. 相似文献
4.
5.
针对人眼对于外界信息的摄取会进行过滤,对于一幅既定的场景,会将其分为目标和背景两部分,对于目标信息的获取会希望更加详细,背景信息没有过多要求的特点,本文研究了联合图像分类的图像融合算法。对给定的待融合图像进行NSCT(Non-subsampled contourlet transform)变换,在NSCT变换域内提取特征,利用K-Means方法将图像分为目标和背景两部分,然后对背景和目标的低频信息采用均值准则、目标的高频信息采用区域能量加权平均的准则进行融合;同时为了降低计算复杂度,将压缩感知应用于图像分类过程中,实验结果验证了本文算法的优越性。 相似文献
6.
在方面信息情感分类中针对使用循环神经网络编码长距离文本的信息丢失问题,以及使用注意力机制提取情感信息时倾向于关注高频信息偏置问题,提出一种多模特征融合的方面信息情感分类方法,区分单点、多点以及局部三类不同表达模式的情感信息,通过对三类情感信息有侧重的关注、提取与融合,实现各类特征间相互确认与纠错,降低信息丢失与关注偏置问题,达到增强复杂情感表达模式下的方面信息情感分类能力的目的。实验结果表明,使用所提出的方法对三类情感信息进行提取与融合,可以使方面信息情感分类任务在准确率和F1值指标上得到进一步提升。 相似文献
7.
电子地图是在电子介质上使用的地图,是一种模拟地图产品,是通过符号系统表示的图像。电子地图界面、图像结构、主次关系及其图面视觉层次设计的优劣,将直接影响电子地图信息的传输效率,从而影响其使用价值。文章介绍了重视电子地图界面及视觉层次设计的意义,阐述了提高视觉感受水平的电子地图界面构图设计要点,探讨了建立高效信息传输的图像视觉层次设计原理和方法。 相似文献
8.
9.
在点云的处理过程中,许多深度学习网络未能充分考虑局部点之间的复杂关系,导致大量空间几何信息丢失.针对该问题,提出了一个强化局部特征的网络,用于点云的目标分类和语义分割.该网络通过设计编码单元对点的多方向信息进行编码;通过注意力机制学习采样分组后形成局部点云的特征.同时提出了一种新的多维损失函数,结合使用交叉熵损失函数与... 相似文献
10.
提出了一种改进的局部二值模式即局部均值模式用于对静态手势进行分类. 计算不同分辨率的原始手势图像、非线性光照变化图像、高斯模糊图像和椒盐噪音图像的局部均值模式、局部二值模式和局部角相模式. 利用gentle_Adaboost 分类算法对这些算子特征进行训练和测试,实现手势分类. 文中提出的局部均值模式能充分利用区域内像素灰度值之间相关性和区别性信息进行编码,恰当地描述不同手势的特征,具有简单快速及良好的区分度等特点. 实验结果表明:与局部二值模式和局部角相模式相比,局部均值模式算子取得了更高的分类准确度.对于原始图像,该描述子的分类准确度达到95%,同时该模式对非线性光照变化和高斯模糊具有较强鲁棒性. 相似文献
11.
12.
13.
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率. 相似文献
14.
针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory, LSTM)网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明:所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。 相似文献
15.
随着特征选择和分类技术研究的不断深入,盲检测的精度越来越高,但现有方法大多不考虑图像自身的内容特性对检测的影响. 该文提出一种基于图像内容和特征融合的盲检测方法,根据图像复杂度将待检测图像划分为不同的子图像库,以巴氏距离度量各局部特征的分类能力并确定权值,在特征融合基础上对各子库提取不同特征,用支持向量机进行分类. 在混合图像库上进行的实验表明,该方法具有更好的检测性能,并降低了运算复杂度. 相似文献