首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
在对各种文本定位与提取方法分析比较的基础上,针对标志牌文本的具体特点,提出了一种基于连通区域的标志牌文本提取方法———在灰度图像中定位标志牌区域,二值图像中提取标志牌文本,并用VC 编程实现对采集的自然场景下的标志牌文本图像进行了实验,结果证明,该方法能够准确定位并提取自然场景下的标志牌文本,获得文本字符。  相似文献   

2.
针对自然场景文本识别过程中文本图像的透视变形问题,提出一种有效的基于消失点的场景文本透视变形校正方法。该方法首先利用由文本字符边缘端点拟合得到的文本基线检测消失点,然后利用消失点信息估计单应矩阵部分参数,使用单应矩阵实现图像校正,得到正视的文本图像。与其他方法相比,该方法受文本版式的限制更少。实验结果表明,该方法能有效校正文字行数较少的场景文本,明显提高字符识别率。  相似文献   

3.
文本区域的字符存在着不同的颜色极性.为了能够正确地把文本区域的灰度图像转换成OCR识别软件可以识别的二值图像,提出了一种判断文本区域字符颜色极性的方法.首先计算文本区域的灰度-梯度共生矩阵,并根据目标函数快速地找到分割的灰度和梯度最佳阈值;然后在此基础上提取特征向量,送入神经网络进行分类;最后根据颜色极性判断的结果,分割出字符.实验结果表明,提出的方法在复杂度不同的背景下,正确地识别出了不同类别的字符颜色极性.  相似文献   

4.
一种基于纹理能量的JPEG图像文本定位算法   总被引:2,自引:0,他引:2  
提出了一种新的JPEG图像人工文本定位算法.该方法直接在DCT域中计算各DCT块的纹理能量特征,并以此初步定位文本区域.然后利用文本的连通和几何特性,精确定位文本区域.实验结果表明,使用该方法可以快速有效地定位JPEG图像中的人工文本区域.  相似文献   

5.
基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去重算法比现有的基于图结构的文本表示去重方法在F1-score指标上提升了10%.最后,该算法能提高新闻文本的去重效果.  相似文献   

6.
一种新的文本数字水印算法研究   总被引:5,自引:1,他引:4  
给出了一种基于文本字符特征的数字水印算法,结合人类视觉特性,于文本字符宽度调整过程中嵌入水印信息。实验结果证明,该算法具有较好的隐蔽性和鲁棒性。  相似文献   

7.
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法.使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网...  相似文献   

8.
文本图像页面分割算法研究   总被引:1,自引:0,他引:1  
提出了一种基于改进纹理谱的文本页面分割算法,该算法首先采用改进的递归投影轮廓切割算法对文本图像页面进行粗分割,并提取文本图像的纹理谱特征;然后采用最小距离法将相邻纹理单元进行分类;最后实现文本图像页面文字区与非文字区的精确分割.实验表明,提出的方法在含有文字、图、表格的文本图像页面分割中效果很好,对其他复杂文本图像页面分割也具有适应性.  相似文献   

9.
基于有序聚类的文本结构分析方法   总被引:1,自引:0,他引:1  
讨论了基于关系图的文本结构分析方法,鉴于文章组织的有序性,运用有序聚类的思想建立数学模型,并利用最优K分法构造自动文本结构分析算法,以划分文章意义段.实验结果表明,该文本结构分析方法是有效的.将该方法运用于自动文摘技术,可使文摘获得更好的可读性和完整性.  相似文献   

10.
基于提升树的自然场景中文文本定位算法研究   总被引:1,自引:0,他引:1  
提出了一种新的基于提升树算法的自然场景中文文本定位技术.首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域.通过实验验证,该算法具有很高的召回率和准确率,综合性能较高.  相似文献   

11.
文本和用户查询用属性坐标表示,以交点与查询重心点的距离确定为文本与查询间的相似度进行计算,利用相关性反馈技术调整检索策略,得到一个基于属性坐标的文本信息检索模型.实验表明,该模型的检索方法可行,检索效果较好.  相似文献   

12.
基于线条识别的扫描工程图字线分割方法   总被引:1,自引:1,他引:0  
在扫描工程图矢量化中,文字位图与图形位图分割的问题一直被广泛关注,许多现有方法根据连通区的形态特征和空间分布来分割文字和图形的位图,然后分别识别,其处理能力都局限在无粘连情况下,无法处理字线粘连及相交的情况,且难以区分尺寸范围相近或形态相似的文字与图形,提出一种基于线条识别的文字/图形分割方法,通过准确地识别线条并抽取其位图来分离文字,不仅保证了分割的正确性,而且为文字位图的字串的组织给出了依据。  相似文献   

13.
针对当前电力文本分类方法中因忽视类别标签之间潜在语义关联关系而导致分类性能低效的问题,提出一种基于层次化分类模型的电力文本分类方法.首先,利用采集的电力成果非结构化文档,采用自动化信息提取技术和标注技术,构建电力文本多标签分类训练集,并结合领域知识分析,构建类别标签之间的层次化关系.然后,提出基于类别结构和标签语义混合...  相似文献   

14.
在文本分类中,当两个多属性类别发生属性重叠时,采用传统的文本分类算法m acro F1值仅为45%左右.为了提高文本分类算法的m acro F1值,提出了基于结果修剪的方法.在该方法中,分类器由多个子分类器组成.每个子分类器对应于类别中的一个属性;在每一个阶段中,每一个子分类器将不属于该属性的文本剔出.当所有子分类器运行结束后,留下的文本即属于该分类的文本.实验数据表明,基于结果修剪的文本分类方法在解决属性重叠问题时能够将m acro F1值提高到65%左右.  相似文献   

15.
通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找"边缘点对",并构建来自笔画等窄带区域的"对称边缘点对"样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%.  相似文献   

16.
提出一种融入背景知识的交互文本立场分析方法。该方法以交互文本作为查询, 从维基百科中检索相关的背景知识文本, 然后对背景知识文本进行编码, 并通过深度记忆网络获取相关的背景知识特征, 以此来增强交互文本的表示学习。在3个英文在线辩论数据集上的实验结果表明, 通过选取适当的背景知识嵌入层数以及背景知识嵌入层连接方式, 可以有效地提高交互文本立场分析性能。  相似文献   

17.
介绍一种从《中国大百科全书》文本中获取军事知识的方法 .该方法由 2部分组成 :第一部分是军事知识描述语言 (MKDL) ,由知识工程师用于将文本知识翻译成基于Concept_Relation_模型的MKDL形式化文本知识 ;第二部分是MKDL编译系统 .该系统通过对MKDL文本的编译、分析和知识连接而最后生成军事知识库 .  相似文献   

18.
一种增量式文本软聚类算法   总被引:1,自引:0,他引:1  
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号