首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
在简要介绍数学公式识别发展状况的基础上,提出了一个基于递归策略的数学公式识别模型.该模型由版面分析和数学公式结构表达两部分组成.版面分析主要是提取文档中的数学公式;数学公式结构的表达采用一种递归算法将公式用结构树表示,它是公式识别的关键环节,该方法对公式结构具有较好的适应性.  相似文献   

2.
区别于传统基于图像和西文文档的公式定位方法, 针对中文电子文档的特点, 提出一种基于机器学习和规则相结合的独立公式和内嵌公式的定位方法。设计了适合中文文档的页面分行策略和词块划分规则; 选择适合中文文档的公式特征和机器学习算法; 针对公式定位中的过分割问题, 提出行合并与词块合并等后处理手段。实验结果表明, 该方法可以有效地从中文电子文档中自动定位公式区域。此外, 构建了公开可用的中文数据集, 以促进不同数学公式定位方法间的相互比较及性能评估。  相似文献   

3.
数学公式重构是公式识别的重要环节,目前相关的研究还很欠缺.针对数学公式重构展开了研究,提出了一种基于MathML的数学公武重构的方案.实验表明,这种数学公式重构方法可以完美准确地表达数学公式,而且可以和目前流行的字处理软件中的公式编辑器兼容.  相似文献   

4.
数学公式识别在拍照搜题、自动阅卷和题库建设等智慧教育任务中有着广泛的应用.由于这些应用中数学公式大多以图片的形式存在,因此识别图片中的数学公式成为智慧教育领域的重要研究问题之一.数学公式结构复杂,从图片中识别数学公式远比一般的光学符号识别要复杂得多.将公式识别分为字符分割、符号识别和公式重组这3个步骤:首先,综合运用投影和连通域方法将字符从图片中分割出来;其次,基于单个字符的区域像素数占总像素比例提取字符特征,建立监督学习模型识别字符;最后,利用每个字符在公式中出现的位置对数学公式进行重组.真实数据集上的实验结果表明,本文提出的数学公式识别方法准确率高达98.0%.  相似文献   

5.
基于Nutch的Web数学公式提取   总被引:1,自引:0,他引:1  
本文主要研究基于公式的数学搜索引擎中数学公式的识别和提取方法,总结了MathML、Open-Math、LaTex、Infix格式数学公式在网页中出现时的各自特征,提出了基于特征和启发式规则的公式识别和提取方法,并用实验说明了该识别和提取方法的可行性和准确率.  相似文献   

6.
现有全文检索技术多是以文本信息为处理对象,对于以数学表达式为主要成分的科技文档检索还处在探索阶段.为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索,提出了一种基于数学表达式特征的科技文档检索模型.首先通过将公式解析为二叉树得到数学表达式的子式信息,利用数学表达式及子式构造检索特征向量;在索引阶段,利用所提取的文档特征向量构建分层结构的索引表;在匹配阶段,对文档向量采用tf-idf进行加权操作,利用余弦相似度对检索向量和文档向量进行相似度计算,得到一个有序的文档检索结果.实验选取了来自不同领域的期刊、学术网站以及公共数据集的5 017篇科技文档,其中包含了96 362条数学公式,平均检索时间为0.428s,表明该模型达到了实现较高效率科技文档检索的目标.  相似文献   

7.
识别和抽取XML文档中的关系信息及其出现模式   总被引:3,自引:0,他引:3  
Web中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对Web中的关系信息进行识别.该文以XML作为研究对象,提出了一种XML文档中识别和抽取关系信息及其出现模式的方法.该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取.实验结果表明提出的XML相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据.  相似文献   

8.
介绍了XHTML+MathML+SVG框架,用其解决XHTML文档中含有文本、数学公式和数学图形以及SVG文档中含有文本和数学公式等Web数学信息问题,并给出了可行的文档结构。并用XITFML1.1+MathMI2.0+SVG1.1DTD定义其它文档结构的DTD,解决其它文档结构的数学信息问题。  相似文献   

9.
目前,传统文本分类算法都是脱离自然语言语意的.该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(CIETC),通过分类补偿文档属性,达到行业文档分类的目的.实验中,以将关于一个人名的所有网络文档自动分类为例,验证了这种面向行业的CIETC分类器的分类性能.结果表明该方法的分类准确率要优于Bayes方法,与KNN方法相当;该方法是一种可行的面向行业细分文本分类方法.  相似文献   

10.
关系抽取是自然语言处理领域的一项基础研究,抽取的结果可以用于知识图谱构建、人机问答、语义搜索等下游任务,具有广泛的应用场景和重要的研究价值。近年来,关系抽取研究取得了丰富的成果,但绝大多数研究局限于句子级关系抽取。研究表明,大量的关系无法通过单个句子提取,随着深度学习和自然语言处理技术的不断发展,文档级关系抽取研究工作迎来了新一轮的机遇和挑战。文中着重对近几年文档级关系抽取的研究进展进行分类和梳理,提炼出文档级关系抽取的一般技术路线图,分析文档级关系抽取研究的特征编码及特征聚合方法,并根据提取特征的不同,将文档级关系抽取方法概括为基于词汇特征、基于句法特征以及基于关系特征的3类方法;同时介绍常用文档级关系抽取数据集和评测指标,并对未来的研究趋势进行展望。  相似文献   

11.
关于数学符号和数学式编排规范的思考   总被引:1,自引:0,他引:1  
按照国家标准局颁布的《科学技术期刊编排规则》的要求,结合国内40种数学期刊和进入SC I的59种国际数学核心期刊的编排格式和书写方式所涉及到的常用国家标准中的部分条款,如数学符号与数学式编排的规范标准,分析了编排中的数学符号使用不规范,数学式转行不科学以及数学式不加标点符号的问题,找出了差距,从而提高了初步看法和改进意见。以便提高我国科技期刊编排格式标准化、规范化的程度。  相似文献   

12.
弹粘塑性问题的边界元分析方法中初应力矩阵的形成占用了整个计算时间的大部分。本文在积分域内采用三角形线性单元的离散形式,导出了该矩阵计算的解析式和半解析式,能更有效地处理奇异积分,提高计算精度,缩短计算时间。同时,编制了相应的计算程序,并给出了用于地下工程稳定分析的实例。  相似文献   

13.
讨论了如何将显式、隐式线性多步法转化为显式、隐式的向量单步形式,对它们进行了傅立叶分析, 给出了它们的可解性假设条件.  相似文献   

14.
在中学数学的教学过程中,几何画板越来越成为数学教师不可或缺的一种教学工具,为学生学习数学营造了一种新的学习环境。文章从几何画板的功能特点,几何画板在中学数学定理公式教学中的优势功能,几何画板在中学数学定理公式教学中的应用等方面进行论述。  相似文献   

15.
试比较电子文献和印刷型文献的优劣   总被引:1,自引:0,他引:1  
从8个方面将电子文献的性能与传统的印刷型文献进行了对比分析,其结果是虽然电子文献有一些很独特的优秀性能,但大部分性能还比不上印刷型文献,因此,电子文献只能是其他栽体文献的完善和补充,而不能取代它们。  相似文献   

16.
电磁场的相对论变换式是相对论电磁理论中的重要公式。本文从四维空时坐标微分算子以及电磁场矢势和标势的相对论变换式出发,根据E=-▽φ-βA/βt和B=▽×A的相对论协变性要求,给出了一种导出电磁场相对论变换式的新方法。该方法物理图像清晰,数学证明简单。  相似文献   

17.
依据房室模型和微分方程理论,对绿色农业生态系统中的分解者亚系统的能量流动过程进行了数学分析,建立了数学模型。稳定性分析结果表明,在绿色农业生态系统中,分解者亚系统能量流动过程中的平衡态是渐进稳定的。即该平衡态的稳定性机制为负反馈机制,该系统具有抵抗干扰和保持系统平衡态的自我调节能力,以确保能量流动的正常进行。最后,通过解微分方程,给出了该系统能量流动的数学模拟公式。  相似文献   

18.
本文较为深入细致地分析了复摆腭式破碎机的运动特性以及腭式破碎机生产率计算公式问题。计算出复摆腭式破碎机动腭运动特性曲线。推导出一组腭式破碎机生产率理论计算公式,并做了相应的验证,得到较好的结果。  相似文献   

19.
利用初等及解析的方法研究了除数函数和除数和函数的渐近公式,并进行了推广,得到了一些有趣的渐近公式。  相似文献   

20.
本文利用了Padon七点五次求积公式,构造了一类特殊有限元空间上的有限元型求积公式,并给出了相应的误差估计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号