首页 | 本学科首页   官方微博 | 高级检索  
     检索      

英文科技文档识别中数学公式定位新方法
引用本文:李峰,吴微.英文科技文档识别中数学公式定位新方法[J].大连理工大学学报,2009,49(1):139-143.
作者姓名:李峰  吴微
作者单位:大连理工大学应用数学系,辽宁大连,116024
基金项目:国家自然科学基金资助项目(10471017,10871220)
摘    要:提出了一种自底向上和自顶向下相结合的定位英文科技文档图像中数学表达式的新方法.首先,利用整幅图像的统计数据计算出用于分类的基准参数,然后利用局部极大成分的水平投影数据进行初步行分割,再利用每行的竖直投影数据将每行的符号分成数个子区域.对每一个子区域依据其性质利用基准参数进行分类,通过对特定类别子区域的适当合并,最终得到文档图像中公式的位置.新方法可以用于处理图文混排的文档图像,能够降低文档中的图片、表格等元素对于公式定位结果的影响.

关 键 词:英文科技文档  图文混排  数学公式  定位  

A novel localization method for mathematical formula in English scientific document
LI Feng,WU Wei.A novel localization method for mathematical formula in English scientific document[J].Journal of Dalian University of Technology,2009,49(1):139-143.
Authors:LI Feng  WU Wei
Institution:LI Feng,WU Wei Department of Applied Mathematics,Dalian University of Technology,Dalian 116024,China
Abstract:A novel bottom-up and top-down mixed method for the localization of mathematics formulas in English scientific document image is proposed.Firstly,a benchmark parameter is calculated using the statistic data of the whole document image.Secondly,the document image is divided into lines with horizontal project data of local-maximum components in the image and each line is divided into some sub-regions in terms of the vertical projection data.These sub-regions are classified in terms of the benchmark parameter....
Keywords:English scientific document  picture-text mixed document  mathematical formula  localization  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《大连理工大学学报》浏览原始摘要信息
点击此处可从《大连理工大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号