首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
图像中的文本区域为判别图像垃圾邮件提供了重要依据.为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法.在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验.实验结果显示,新方法具有良好的文本区域提取性能.  相似文献   

2.
由于受公路技术等级、功能差异和地区经济发展不平衡的影响,传统连通度和模糊连通度的计算方法很难真实反映区域公路网的连通状况.基于公路适应交通量、公路重要度和节点重要度对连通能力的影响进行分析,分别对节点连通度和网络连通度的定义做新的描述,提出区域公路网连通度的计算模型.通过实例表明,考虑连通能力的区域公路网连通度计算模型不仅能真实反映区域公路网的结构性能,而且还可以对节点连通度进行排序,深化了连通度的内涵,有助于为区域交通规划提供决策参考.  相似文献   

3.
利用局部显著文字型区域描述结合连通分量分析思路,文章提出一种复杂背景下针对场景文本稳健的文本提取算法.该算法首先通过灰度的局部显著变化和显著多方向边缘强度定位图像的显著文本区域;然后依据区域灰度变化将原始图像进行分割,获得显著区域的连通分量包括文本分量和非文本分量;接着用一个级联分类器基于字符属性滤除部分非文本连通分量,最后统计文字包围盒的边缘方向分布信息,对每个候选连通分量提取8维的特征送入SVM分类器进行验证,最终定位出文本区域.实验结果表明,这种基于显著区域提取文本的算法有效地结合了文本的区域特性和文本连通体的笔画属性,在保证文本提取正确率的同时提高了算法速度,测试结果表现出较满意的性能.  相似文献   

4.
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。  相似文献   

5.
本文研究二连通区域的一个模问题。设D是一个环形区域。若mod(D)>1/2,则D包含一个圆环A分离D的边界,且满足 mod(A)≥mod(D)-1/2.  相似文献   

6.
周期单连通区域的标准化   总被引:1,自引:1,他引:0  
本文指出,经单叶共形映照,周期单连通区域可在保持周期性的条件下,标准化为全平面、半平面或直线边带形域,如还要求保护区或边上某些特殊点的性态,则有某些具周期半无限直裂纹的标准区域。  相似文献   

7.
胡波  覃溪  高远 《科学技术与工程》2012,12(26):6763-6765,6786
提出了一种基于连通区域选择的导航线特征点确定算法。首先在传统农业图像分割的基础上选取面积最大的连通区域,然后通过开操作去除连通区域边界的毛刺,再逐行提取图像的特征点。对25幅图像分别按传统方法,未进行开操作的连通区域选择法,进行开操作的连通区域选择法进行导航线特征点提取,统计分析结果表明与传统方法比较进行开操作的连通区域选择法的特征点误差显著降低。  相似文献   

8.
本文利用Poincare度量,证明了模为1/2πlogr~2的二连通区域的Bloch-Landau常数Lr和Bloch常数Br的精确下界估计:  相似文献   

9.
基于内容的索引和检索是实现巨量数字视频资料有效检索与浏览的一种重要方法,是当今的研究热点之一,而检测提取其中的文本是实现该目标的一个重要途径。文章提出一种检测提取图像中文本的新方法,其特点在于应用模糊技术对子图像变异灰度直方图(VGH)中的文本映射特征进行识别,从而实现检测定位图像中的文本;在讨论子图像VGH中文本映射特征性质和阈值参数选取算法的基础上,着重研究了模糊技术用于文本映射特征识别问题,给出了具有鲁棒性的文本检测提取算法;实验结果表明,新方法切实可行,相关算法正确有效。  相似文献   

10.
自然场景文本区域定位是场景图像内容分析的重要步骤,文本区域定位能够为后续的文本识别提供便利.从场景文本特性出发,提出了一种基于最大极值稳定区域(maximally stable extremal regions,MSER)、颜色聚类和视觉显著性的鲁棒性文本定位方法.为了尽可能多地提取出潜在的文本区域,分别在灰度图像和彩色图像上采用最大极值稳定区域和颜色聚类来进行连通域的分析.对于得到的候选连通域,利用自然场景文本的显著性特征和少量的先验信息来滤除其中的非文本区域.将保留的文本区域用数学形态学水平膨胀的方法连成文本行输出.显著性评估的引入使得该方法能够减少大量参数的设定.标准数据集上的实验结果表明,在没有额外的训练数据和少量先验信息的情况下,该方法可以获得较好的正确率和召回率.  相似文献   

11.
通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找"边缘点对",并构建来自笔画等窄带区域的"对称边缘点对"样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%.  相似文献   

12.
PDF文件文本内容提取研究   总被引:2,自引:0,他引:2  
介绍了PDF的文件结构,在此基础上,给出了PDF文件的解析流程,以及从解析后的内容流中提取文本内容的方法。  相似文献   

13.
Introduction The objective of the integrated approach is the devel-opment of optimal flow sheet with minimum re-sources[1]. Too often new solvent extraction (SX) proc-esses are implemented before the development wascompleted, only to be sent back to the l…  相似文献   

14.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

15.
Density-based approaches in content extraction, whose task is to extract contents from Web pages, are commonly used to obtain page contents that are critical to many Web mining applications. However, traditional density-based approaches cannot effectively manage pages that contain short contents and long noises. To overcome this problem, in this paper, we propose a content extraction approach for obtaining content from news pages that combines a segmentation-like approach and a density-based approach. A tool called BlockExtractor was developed based on this approach. BlockExtractor identifies contents in three steps. First, it looks for all Block-Level Elements (BLE) & Inline Elements (IE) blocks, which are designed to roughly segment pages into blocks. Second, it computes the densities of each BLE&IE block and its element to eliminate noises. Third, it removes all redundant BLE&IE blocks that have emerged in other pages from the same site. Compared with three other density-based approaches, our approach shows significant advantages in both precision and recall.  相似文献   

16.
提出了一种基于纹理图像的目标提取方法。该方法基于随机掩膜来进行目标边缘的提取,目的是检测蕴藏在纹理中的目标。结果表明:提出的方法能够检测到隐藏在纹理中的目标,具有较好的效果。  相似文献   

17.
总结连接成分是一种重要的篇章连接手段,它前后项的语义关系有并列、递进、因果、分总等关系,通过分析.我们发现,前后项的语义关系并不是简单的归纳概括关系,后项是在前项的基础上改换另一种说法,来达到帮助读者或听者掌握作者或说者意图的目的。  相似文献   

18.
文本内容主题的识别方法   总被引:4,自引:2,他引:4  
提出了一种基于知识的内容主题识别方法,其中采用基于统计和规则的技术进行主题特征识别,利用集聚公式进行主题特征集聚分析·通过引入领域知识库,将基于词汇的分析技术提升到领域知识计算层面·实验结果显示主题识别平均正确率为70%·  相似文献   

19.
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望.  相似文献   

20.
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题。针对LDA主题模型提取主题特征时存在冗余的不足,提出一种基于邻域粗糙集的LDA主题模型约简算法NRS-LDA。利用邻域粗糙集构造主题决策系统,通过预先设定主题个数,计算出每个主题的重要度;根据重要度进行排序,将排序后重要度低的主题删除。将提出的NRS-LDA算法应用于K-means文本聚类问题上并与传统的文本特征提取算法及改进的算法进行比较,结果表明NRS-LDA方法可以得到更高的聚类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号