首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 673 毫秒
1.
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。  相似文献   

2.
彝文古籍中字符的检测是古彝文字符识别的重要基础,检测的准确性直接影响着古彝文识别的精准程度。针对彝文古籍文献版面结构复杂、排版缺乏规范、存在图文混排等情况,提出一种基于最大极值稳定区域(MSER)和卷积神经网络(CNN)的彝文古籍文献字符检测方法。首先对彝文古籍扫描图片用非局部均值滤波进行了预处理,然后采用一种改进的局部自适应二值化方法得到二值图像,实现对图像的前景和背景的分割;再采用基于启发式规则的方法对非文本区域进行去除,从而得到文本区域;最后采用MSER和CNN相结合的方法对古籍中的单个字符进行检测。实验结果表明,该方法对古籍中文本和非文本区域进行了有效的分离,并在单字符检测实验中取得了较高的准确率和召回率,能有效地解决古籍文献字符识别中的字符检测问题。  相似文献   

3.
利用局部显著文字型区域描述结合连通分量分析思路,文章提出一种复杂背景下针对场景文本稳健的文本提取算法.该算法首先通过灰度的局部显著变化和显著多方向边缘强度定位图像的显著文本区域;然后依据区域灰度变化将原始图像进行分割,获得显著区域的连通分量包括文本分量和非文本分量;接着用一个级联分类器基于字符属性滤除部分非文本连通分量,最后统计文字包围盒的边缘方向分布信息,对每个候选连通分量提取8维的特征送入SVM分类器进行验证,最终定位出文本区域.实验结果表明,这种基于显著区域提取文本的算法有效地结合了文本的区域特性和文本连通体的笔画属性,在保证文本提取正确率的同时提高了算法速度,测试结果表现出较满意的性能.  相似文献   

4.
为了解决在复杂场景中进行车牌定位的问题,提出了一种基于MSER与DRLBP特征的车牌定位方法。首先对输入图像进行预处理,然后在多个通道上进行MSER候选区域提取;接着利用所设计的基于车牌字符合并的车牌定位方法进行车牌字符合并;最后利用DRLBP纹理特征对合并后的区域进行验证从而得到最终的车牌区域。实验结果表明该方法具有较好的定位能力。由于方法是通过寻找车牌字符进而定位车牌位置,因此其受车牌颜色、车牌格式的影响较小,在复杂环境中对国内外不同车牌均有较好定位效果。  相似文献   

5.
提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后利用动态规划算法搜索出最佳切分假设.使用哈尔滨工业大学多人手写真实文本数据库中的383个文本行对文中方法进行实验,在无语言模型的情况下,切分准确率可以达到89.70%,从而验证了所提字符切分方法的有效性.  相似文献   

6.
提出一种基于过渡像素的视频流人工文本检测与定位算法.该算法在水平和垂直方向上提取过渡像素点,生成过渡图.通过块滤波器抑制背景的过渡像素,采用基于密度的快速区域生长算法形成候选文本区域;再利用改进的局部二进制模型(LBP)验证候选文本区.仿真实验结果表明,本文的改进算法相对于Kim算法,字符定位的准确率更高.  相似文献   

7.
基于提升树的自然场景中文文本定位算法研究   总被引:1,自引:0,他引:1  
提出了一种新的基于提升树算法的自然场景中文文本定位技术.首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域.通过实验验证,该算法具有很高的召回率和准确率,综合性能较高.  相似文献   

8.
针对自然场景文本检测在复杂背景下虚警高的问题,提出利用小波变换(wavelet transform,WT)和方块编码算法(block truncation coding,BTC)相结合的方式(WT-BTC)表征文本纹理,并结合支持向量机(support vector machine,SVM)完成对候选文本区域的分类确认。算法首先利用边缘检测和启发式规则快速确定候选文本区域;然后对候选文本区域进行小波分解和BTC编码,提取水平、垂直、对角方向的WT-BTC纹理特征;使用三个SVM分类器分别对不同方向纹理特征学习训练,组合SVM模型实现候选文本区域的二次检测,确认文本区域。实验结果表明算法提高了文本区域检测鲁棒性,在复杂背景条件下对场景文本有较好的检测效果。  相似文献   

9.
针对暴力视频的检测方法均是单一模态的且效率相对较低等问题,提出文本、视频以及音频3种模态的信息融合算法,构建网络暴力视频识别系统,设计文本以及视音频分类器;将文本分类器当做预分类器完成视频的分类操作,从而获得候选暴力影视,随之运用视音频分类器完成对其的进一步分类;开展实验分析,并与单一模态的分类算法进行对比。结果表明,该信息融合算法显著提升了识别精度,缩减了计算量,改善了分类效果。  相似文献   

10.
自然场景中字符型交通标志的检测算法   总被引:1,自引:0,他引:1  
提出一种检测城市和高速公路环境中字符型交通标志的新方法.首先,在输入图像中分割出蓝色和墨绿色区域,用形态滤波和形状标记图判断交通标志的候选区域;其次,将候选区域的彩色图像灰度化,用Otsu算法计算候选区域灰度分布直方图的阈值,并对其进行分割,得到包含字符的二值图像;然后,将候选区域的二值图像向垂直方向上投影,用3次样条拟合算法对其进行拟合,利用曲线的性质,找到拟合曲线中的局部极小值点,分割出包含字符条形区域;最后,将条形区域向水平方向上进行投影和曲线拟合,查找局部极小值点并分割出单个字符区域,再进行形态过滤,分割并定位交通标志中的字符.实验结果表明:该算法的字符查全率高于84%,准确率超过92%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号