首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于投影法的文档图像分割算法   总被引:1,自引:0,他引:1  
提出了一种基于投影法的中文文档图像分割算法,从文档图像的投影出发,根据文档图像水平投影的统计特性,进行灰度值累加,找到每行文字所在坐标;根据文字的竖直投影形状特征,进行竖直方向上的分割,通过对字符图像的分割,实现对整篇文档的分割;对各种字体的文档图像的灰度图进行了试验.结果表明,该算法能够准确地对文档图像进行分割.  相似文献   

2.
基于分层密度特征的文档图像检索   总被引:1,自引:0,他引:1  
为克服基于版面重建的文档图像检索方法对图像质量要求高,且局限于部分文种,以及基于版面分割的文档图像检索方法受限于版面分割技术等问题,提出了一种基于二值文档图像分层密度特征的检索方法。该方法通过倾斜校正、去除黑边等预处理得到有效文本区域,提取有效文本区域的长宽比和分层密度特征,通过特征比对进行检索。实验表明:该方法对不同分辨率以及不同的输入设备具有自适应能力,对复杂版面和批注等噪声鲁棒性好,漏检率为2%,是一种简单有效的文档图像检索方法。  相似文献   

3.
垃圾邮件制造者为了躲避基于文本的垃圾邮件过滤器的过滤,常常将文字嵌入到图像中,产生了大量的广告垃圾图像.为解决这一问题,提出了基于图像内容的垃圾图像过滤方法.首先提取出图像中的文字区域,再利用广告垃圾图像中的文字区域特征进行广告垃圾图像过滤.实验结果表明利用文字区域特征过滤广告垃圾图像是行之有效的.  相似文献   

4.
由于声呐图像受噪声污染严重,导致水下多目标分割存在精度低的问题.为此,提出一种自调整谱聚类结合熵权法进行多特征赋权的水下多目标分割技术.该技术首先通过自调整谱聚类对声呐图像的像素点进行聚类处理,使图像划分为多个独立的区域,然后根据多特征的互补性和冗余性统计每个区域的信息熵、亮度、对比度和狭长度等特征,利用熵权法对多特征进行赋权并筛选出最优的一个目标区域,再将该最优目标区域和所有区域进行多特征相似度匹配,最后根据相似度的匹配结果使用自适应阈值迭代法自动分割出所有的目标区域.实验结果表明没有对噪声干扰区域误分割,分割出的目标区域精度更高,验证了所提方法的有效性.  相似文献   

5.
文本图像页面分割算法研究   总被引:1,自引:0,他引:1  
提出了一种基于改进纹理谱的文本页面分割算法,该算法首先采用改进的递归投影轮廓切割算法对文本图像页面进行粗分割,并提取文本图像的纹理谱特征;然后采用最小距离法将相邻纹理单元进行分类;最后实现文本图像页面文字区与非文字区的精确分割.实验表明,提出的方法在含有文字、图、表格的文本图像页面分割中效果很好,对其他复杂文本图像页面分割也具有适应性.  相似文献   

6.
版面分析是一个将文本页面图像分割成不同区域,并标定区域类型(如文字、图片、表格等)的过程,与字符识别具有同等重要的地位.提出了一种基于连通域的蒙古文版面分析方法,它提取文档图像中所有连通域,根据连通域的大小进行聚类,从而可以得到文字连通域和非文字连通域,达到分割版面的目的.实验证明,该算法能够对蒙古文书籍版面进行准确的分析.  相似文献   

7.
针对传统区域生长算法对噪声敏感和初始种子过度依赖的问题,本文提出一种基于显著图的遥感图像多分辨区域生长分割方法.该方法利用亮度、颜色、方向三个特征金字塔生成显著图,通过视觉选择注意模型自动选择注意区域作为种子区域.从能分辨种子区域的最大尺度开始区域生长,直到0尺度,从而分割出对遥感图像中感兴趣的区域.实验结果表明该方法能有效地从遥感图像中分割出视觉注意的区域,且有较快的速度.  相似文献   

8.
边缘流分割算法可利用图像的多种特征进行准确的图像分割,但传统的边缘流分割算法运算复杂度高,容易造成过分割.针对这些问题,作者对边缘流算法进行改进,并提出一种基于边缘流和区域合并的图像分割方法.该方法首先对原始彩色图像进行改进的边缘流分割;再通过曲线演化和边缘连接得到封闭的边缘;最后根据区域颜色相似度对初分割的图像进行区域合并,得到最终的分割结果.实验表明,该方法提高了分割效率,解决了过分割问题,将该方法应用于岩屑颗粒图像分割取得了较好效果.  相似文献   

9.
由于医学图像的复杂性,一般图像分割方法对于医学图像的分割效果并不理想.针对医学CT图像特点,提出了一种把边缘检测和基于区域方法相结合的图像分割算法,首先使用Sobel算子进行边缘检测,检测出目标可能的边缘像素集,并计算该点的平均灰度,然后利用该灰度及目标区域的连通性作为生长判别条件,利用区域生长法实现图像的准确分割.实验结果表明, 该方法避免了单独使用边缘检测或基于区域法进行图像分割时的典型错误,结合了两者的优点,取得了感兴趣目标的良好分割效果.  相似文献   

10.
基于标记和模糊聚类的分水岭声纳图像分割   总被引:1,自引:0,他引:1  
针对传统分水岭算法在处理声纳图像时存在严重的过分割现象,提出一种结合分割前处理和后处理两类方法优点的算法.首先利用H-min变换技术提取区域极小值和新的标记,对标记后的图像进行分水岭图像分割;然后结合改进适应度函数的粒子群全局寻优算法,从初分割的小区域中搜索出较为准确的初始聚类中心,利用这个聚类中心和改进目标函数的模糊C均值聚类算法,再对分割后的小区域聚类,并控制迭代次数,以提高分割速度.实验结果表明:该方法能够有效消除过分割现象,提高声纳图像处理效果,有效分割率达89%,处理时间提高30%以上.  相似文献   

11.
基于提升树的自然场景中文文本定位算法研究   总被引:1,自引:0,他引:1  
提出了一种新的基于提升树算法的自然场景中文文本定位技术.首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域.通过实验验证,该算法具有很高的召回率和准确率,综合性能较高.  相似文献   

12.
JBIG2是即将实施的文档图像压缩编码标准,主要应用于传真,互联网和无线传输,其编码对象是文字与二值图像的混合文档,通过对特定内容采用特定的模式算法进行编码,图像分割是编码的第一步工作,文中在简述JBIG2标准后,通过对文字和二值图像的特征分析,提出了一种新的与轮廓无关的文档分割算法,快速准确具有一定的适应性,经过实验证明,该方法比较有效。  相似文献   

13.
提出一种基于Mask R-CNN深度学习框架的满文文档版面分析方法,将满文文档版面分析问题转化为基于深度学习的图像实例分割问题。使用ResNet101网络和FPN网络构成的卷积神经网络自动提取满文文档图像特征,特征图经过RPN网络和RoI Align层生成新的特征图。新特征图经过全连接层完成感兴趣区域的类别和边框预测,并经过全卷积神经网络对感兴趣区域的像素进行分类得到mask预测,最终实现满文文档图像的实例分割。通过《新满汉大辞典》的文档图像构建了满文文档图像数据集,算法在该满文文档图像数据集上进行了实验。实验结果表明,本算法在满文文档版面分析中取得了较好的检测和分割效果。  相似文献   

14.
0 IntroductionDigital watermarkingis a technique toinsert a digital sig-natureinto ani mage sothat the signature can be extrac-ted for ownership verification and/or authentication. Robustwatermarks are generally used for copyright and ownershipverification,whilefragile watermarks are useful for authentica-tion and integrity attestation[1 ,2]. Afragile watermark pro-vides a guarantee that the digital data has not been tamperedwith and came fromthe right source,soit may be called au-thentication…  相似文献   

15.
一种基于二值印刷图像的数字水印方案   总被引:4,自引:0,他引:4  
针对商业文档的完整性保护问题,提出了一种数字水印方案.由于方案是基于印刷文本的,所以关键是解决在二值图像上水印嵌入和提取的方法.方案提出了基于文字区域嵌入水印的方法,即将文字分割成若干区域,并以区域中0/1比率作为特征量来决定水印的数值.在大量实验基础上,总结了如何在二值文本图像中非显见地改变图像的原则.在仿真实验中,主要证明方案对于硬件差异的稳健性,结果表明,方案能够达到应用的要求,是一种可用的有潜力的方法.  相似文献   

16.
针对传统虚假新闻检测方法主要采用图像统计学和图像分布式表示特征导致没有深层次挖掘图像所表达的文字含义的问题,设计了在融合知识图谱和图像描述的深度学习下的多模态虚假新闻检测模型.该模型一方面抽取出在新闻文本中的3元组形式知识图谱,另一方面生成图像对应的描述文本,同时采用Bert框架将原文本、3元组、图像描述文本加以集成.在基准汉语虚假新闻语料库上的实验结果表明:该模型显著优于传统的代表性方法.  相似文献   

17.
冯炎  陈汝真 《科学技术与工程》2020,20(26):10835-10839
文档图像二值化是文档分析与识别中的一个重要环节。本文针对低质量手写体文档图像提出了一种二值化算法,算法首先对文档进行相位保持降噪并计算背景修复模板,然后用图像修复算法和形态学闭运算估计文档背景,用背景补偿算法提高文档对比度,接着用背景补偿后的文档图像构造拉普拉斯(laplacian)能量,最后采用图割算法求得最终二值化结果。实验结果表明,本文所构造拉普拉斯能量能够较准确地区分文字和背景,所提二值化算法在DIBCO2018数据集中的实验结果优于同类算法。  相似文献   

18.
使用图像处理技术来实现汉字书写学习系统.首先,对系统的两个主要模块,即笔画学习和汉字书写,进行了功能阐述;然后,对系统开发所涉及到的3个主要技术要点进行了实现;最后,通过实验对本文系统和基于Flash技术系统进行了对比分析.实验表明,基于图像处理技术的实现作为开发汉字书写学习系统的一种全新思路,取得了优于基于Flash技术的性能指标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号