共查询到20条相似文献,搜索用时 62 毫秒
1.
《烟台大学学报(自然科学与工程版)》2017,(2)
头部姿态估计是检测驾驶员打瞌睡的一个重要手段.针对传统彩色图像存在的易受遮挡、光照变化和不均匀的干扰,仅仅通过微软公司的Kinect传感器提供的深度图像流,利用具有判别性的随机回归森林实时估计头部的位置和朝向.首先构造决策树,联合决策树生成随机森林,在训练分裂节点过程中同时减小类标签分布的熵值和头部位置和朝向的方差.在训练过程中,考虑到深度图像不仅仅有头部,还包括驾驶员上半身,因此在投票确定头部姿态之前,需要将头部图像块分类出来.最后在模拟的真实车内环境进行实验,结果证明,光照的明暗变化和部分遮挡以及驾驶员的本身的穿戴(例如戴墨镜和戴帽子等)对头部姿态的估计没有影响,本文的方法具有较好的鲁棒性. 相似文献
2.
彝文古籍中字符的检测是古彝文字符识别的重要基础,检测的准确性直接影响着古彝文识别的精准程度。针对彝文古籍文献版面结构复杂、排版缺乏规范、存在图文混排等情况,提出一种基于最大极值稳定区域(MSER)和卷积神经网络(CNN)的彝文古籍文献字符检测方法。首先对彝文古籍扫描图片用非局部均值滤波进行了预处理,然后采用一种改进的局部自适应二值化方法得到二值图像,实现对图像的前景和背景的分割;再采用基于启发式规则的方法对非文本区域进行去除,从而得到文本区域;最后采用MSER和CNN相结合的方法对古籍中的单个字符进行检测。实验结果表明,该方法对古籍中文本和非文本区域进行了有效的分离,并在单字符检测实验中取得了较高的准确率和召回率,能有效地解决古籍文献字符识别中的字符检测问题。 相似文献
3.
医疗图像的文本区域检测在网络协同诊疗和医疗云的迅速发展中起着至关重要的作用。鉴于医疗图像相对复杂、文本字体太小而难以提取这一特殊问题,本文有针对性地提出了一种基于最大稳定极值区域算法与改进的角点检测算法相结合的医疗图像文本区域检测算法。该算法首先使用成分特征分析对最大稳定极值区域进行滤除,其次使用改进的SUSAN(Smallest Univalue Segment Assimilating Nucleus,最小核值相似区)角点检测算子对剩余最大稳定极值区域进行检测并滤除,最后将检测出的所有文本区域使用膨胀处理进行合并即可得到医疗图像的文本区域。实验结果表明,使用该算法提取出的医疗图像文本区域的准确率、召回率和综合性能分别为0.9、0.92和0.91,达到了理想的检测效果。 相似文献
4.
为了解决在复杂场景中进行车牌定位的问题,提出了一种基于MSER与DRLBP特征的车牌定位方法。首先对输入图像进行预处理,然后在多个通道上进行MSER候选区域提取;接着利用所设计的基于车牌字符合并的车牌定位方法进行车牌字符合并;最后利用DRLBP纹理特征对合并后的区域进行验证从而得到最终的车牌区域。实验结果表明该方法具有较好的定位能力。由于方法是通过寻找车牌字符进而定位车牌位置,因此其受车牌颜色、车牌格式的影响较小,在复杂环境中对国内外不同车牌均有较好定位效果。 相似文献
5.
提出了一种基于Faster R-CNN深度学习框架的交通标志检测方法,使用VGG16卷积神经网络自动提取交通标志图像特征,并将卷积特征图传入区域建议网络(RPN)中进行前景目标筛选及回归目标边框,将建议区域框映射到特征图上,经过RoI池化层后输出固定大小的建议框,利用分类网络对建议区域进行具体的类别判断,并精确回归目标的边框。并将算法在德国交通标志数据集GTSDB进行了实验验证,实验结果表明了所提出算法的有效性,该方法对不同光照、遮挡、标志模糊等具有鲁棒性。 相似文献
6.
《西安交通大学学报》2017,(1)
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。 相似文献
7.
8.
《南京理工大学学报(自然科学版)》2021,45(1)
为了提高网络入侵检测性能,采用快速区域卷积神经网络(Faster region-convolutional neural network,Faster R-CNN)深度学习的方法来完成网络入侵检测。在网络上抓取网络数据包,数值化和归一化处理得到网络数据样本,通过卷积神经网络(Convolutional neural network,CNN)进行网络入侵数据特征提取,根据特征提取结果进行区域候选网络训练,生成多样化尺寸的基准矩形框,每个矩形框设置4个修正参数,根据修正参数及多个矩形框坐标,获得网络入侵样本的候选生成区域,最后采用分类回归网络训练,结合空间金字塔池化修正不同尺寸矩形框,并采用Softmax分类器,生成不同网络攻击类型的置信度,从而获得网络攻击类型分类结果。通过差异化设置CNN和区域候选网络训练时的卷积核尺寸和区域候选网络训练时的基准矩形框数目,验证合适样本集的卷积核尺寸和矩形框数目。结果表明,相比常用网络入侵检测算法,合理设置卷积核尺寸和基准矩形框数目,能够获得更高的网络入侵检出率和检测时间性能。 相似文献
9.
采用多种深度线索获取二维视频深度,可以提高视频深度提取效果.针对运动线索,通过块匹配运动估计算法获得帧间深度信息;针对帧内线索,采用Laws滤波器提取深度特征,然后利用马尔可夫随机场模型训练获得帧内深度信息;在此基础上,提出了基于信息融合的二维视频深度提取方法.该方法首先通过计算背景和运动区域的信息熵,然后利用模式识别中的Neyman Pearson准则确定视频帧的运动区域.针对该区域,在帧内深度信息获取的基础上,融合帧间深度信息.实验结果和真实深度比较,证实了该方法的有效性. 相似文献
10.
为解决目标跟踪过程中快速运动模糊、背景相似干扰、目标状态变化等问题,基于孪生网络跟踪算法,提出三联区域候选神经网络(TripleRPN)算法与跟踪区域自适应策略(TAA)相融合的目标跟踪方法(TAA+TripleRPN).三联区域候选神经网络根据当前跟踪结果实时更新网络匹配模板,提高了跟踪器对目标状态变化的敏感性.通过区域自适应策略,根据区域候选回归网络分类分支的得分在网络的两组输出间择优选择,提高算法长时跟踪的鲁棒性.针对背景相似干扰和目标状态变化的问题时,TAA+TripleRPN跟踪器能达到更好的跟踪性能.在OTB2015数据集上,算法的AUC达到66.31%,CLE达到88.28%.在实际场景中实现验证与应用,跟踪效果良好. 相似文献
11.
自然场景文本区域定位是场景图像内容分析的重要步骤,文本区域定位能够为后续的文本识别提供便利.从场景文本特性出发,提出了一种基于最大极值稳定区域(maximally stable extremal regions,MSER)、颜色聚类和视觉显著性的鲁棒性文本定位方法.为了尽可能多地提取出潜在的文本区域,分别在灰度图像和彩色图像上采用最大极值稳定区域和颜色聚类来进行连通域的分析.对于得到的候选连通域,利用自然场景文本的显著性特征和少量的先验信息来滤除其中的非文本区域.将保留的文本区域用数学形态学水平膨胀的方法连成文本行输出.显著性评估的引入使得该方法能够减少大量参数的设定.标准数据集上的实验结果表明,在没有额外的训练数据和少量先验信息的情况下,该方法可以获得较好的正确率和召回率. 相似文献
12.
基于颜色增强变换和MSER检测的烟雾检测算法 总被引:1,自引:0,他引:1
在远距离烟雾视频监控中,当烟雾区域小或运动缓慢时,烟雾检测变得非常困难,为了解决这一问题,提出了一种基于烟雾增强颜色变换和MSER(maximally stable extremal regions)检测的烟雾检测算法.首先提出了一种新型烟雾增强颜色变换,可使变换后图像中烟雾区域更加突出,便于后续的分割;其次在变换图像上检测MSER区域,分割出烟雾区域,避免了基于颜色信息或运动信息等传统方法难以准确分割烟雾的缺点;最后针对烟雾的特点,提出了烟雾的静态和动态判据,并以通过静态和动态判据的次数判定是否为烟雾,并进行报警.实验结果表明,该算法可在远距离烟雾视频监控中准确地检测出烟雾区域,具有较高的可靠性. 相似文献
13.
数据深度是一种新的数据分析技术,利用这种技术时数据进行分析和加工,从而获得有用和可信的信息,为决策提供可靠的依据。 相似文献
14.
针对实际生活中普遍存在的多视角、多人脸检测问题,提出了一种新的分类器训练方法及人脸检测的解决方案;首先采用NPD差分特征对人脸特征进行描述,NPD特征通过判断两个像素值间相对差异对人脸进行描述,其特征值可从二维表直接获取,能大大节省训练时间;同时提出了一种深度二叉特征树结构来训练分类器,可有效结合特征间的关联性,将训练得到分类器与肤色算法相结合来提高检测速度;通过在CMU人脸数据库上对所提出算法进行验证,仿真结果证明在多人脸、多视角检测背景环境下,该算法较Ada Boost算法在检测率提高了8.7%,误检率降低了4.1%,检测速度提高了27.7%。 相似文献
15.
考虑到目前针对3维高效视频编码标准的视频水印算法缺乏的问题,提出一种基于深度帧内跳过模式的视频水印算法.首先,分析深度帧内跳过模式的编码过程,并将该模式的4种预测类型分为垂直、水平两大类;其次,进一步分析帧内误差传播问题,对深度帧内跳过模式的预测类型与水印值不匹配的嵌入单元进行选择,以消除传播误差.最后,根据水印嵌入前、后的率失真代价变化来决定是否修改其预测类型.结果表明:在不同的量化参数下,平均每帧嵌入容量分别为649.567,340.155,173.286和58.130 bit,平均比特率变化分别为0.043%,0.046%,0.460%和0.018%.算法对比结果还表明:文中所提算法具有更大的嵌入容量,对比特率的影响更小,在对比特率影响小的同时具有一定的抗重编码攻击性能. 相似文献
16.
复杂背景图像中圆检测的新算法 总被引:1,自引:0,他引:1
如何在复杂背景图像中确定圆的存在,并将其准确定位,具有广泛的工程应用价值.本文通过对大量圆定位算法的研究,提出了一种利用圆形性特征在复杂背景图像中进行圆检测的新算法.经实验证明,此算法实现了复杂背景图像中圆形炮管的自动定位与分割,对于发生形变的图像,此算法仍具有较好的位移、旋转和伸缩不变性,可应用于工程中的圆检测. 相似文献
17.
基于颜色直方图的Cam Shift目标跟踪方法不能适应复杂环境,特别是环境中有相似颜色干扰的情况.针对这一不足,提出了一种基于颜色直方图和深度信息的Cam Shift目标跟踪方法.通过对比试验,证明深度信息的引入,大大削弱了复杂环境对跟踪效果的影响,提高了目标跟踪的鲁棒性. 相似文献
18.
SFRC的抗侵彻性能目前研究较少,尚无侵彻深度计算的有效公式. 本文开展了SFRC试件的准静态和动态单轴压缩试验,分析了钢纤维的增韧效应,指出韧度是影响SFRC侵彻深度的主要因素. 以钢纤维的掺入量ρf及其长径比lf/df之积表征韧度,通过量纲分析给出了计入韧度影响的SFRC侵彻公式,并进行SFRC靶标实弹试验标定了公式的系数,得到SFRC侵彻深度计算的实用工程算法. 相似文献
19.
研究了一种新的被动测距方法.利用测量被动成像系统光学散焦的数字图像处理方法,分析光学散焦程度的变化与景物深度的关系,提出了一个散焦被动测距的计算公式,并得到了一些实验结果.该方法只需对景物采集两幅有差别的图像,避免了大量图像的采集和存储,两幅有差别图像是通过改变摄像机镜头的光圈系数来获得的,避免了图像间的位置校准和匹配. 相似文献
20.
提出了一种新的基于信息传递的MIMO系统符号检测算法.该算法首先采用MMSE方法进行均衡,以均衡后的软信息为基础,按照各接收天线上接收信号的信干噪比大小,以单个接收天线为单位,依次对选定的发送符号作进一步判决,每次判决的结果均传递给其他接收天线,用来参与对其他符号的检测.理论分析和仿真结果均表明,该算法可以有效改善传统MMSE均衡的效果,在接收天线数目不是很大的情况下,可以取得与V-BLAST算法相当的性能,相比于V-BLAST算法,计算复杂度大大降低. 相似文献