首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
现有全文检索技术多是以文本信息为处理对象,对于以数学表达式为主要成分的科技文档检索还处在探索阶段.为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索,提出了一种基于数学表达式特征的科技文档检索模型.首先通过将公式解析为二叉树得到数学表达式的子式信息,利用数学表达式及子式构造检索特征向量;在索引阶段,利用所提取的文档特征向量构建分层结构的索引表;在匹配阶段,对文档向量采用tf-idf进行加权操作,利用余弦相似度对检索向量和文档向量进行相似度计算,得到一个有序的文档检索结果.实验选取了来自不同领域的期刊、学术网站以及公共数据集的5 017篇科技文档,其中包含了96 362条数学公式,平均检索时间为0.428s,表明该模型达到了实现较高效率科技文档检索的目标.  相似文献   

2.
针对科技文档间相似程度和影响力不同的问题,通过分析科技文档间非对称关系,提出一种新的度量方法.该方法将科技文档间非对称关系定义为文档覆盖度,并用公式覆盖度和文本覆盖度对其进行度量.公式覆盖度由改进的非对称因子计算,文本覆盖度通过利用文本的相对突出性调整特征向量的余弦夹角计算,公式覆盖度和文本覆盖度线性融合得到科技文档覆盖度.实验结果表明:与已有的2种科技文档关系度量方法相比,本文提出的非对称关系度量方法在聚类中的平均准确率分别提高了8%和4%.  相似文献   

3.
刘虹 《安徽科技》2002,(9):46-47
日常工作中,人们在计算机上无论是写论文、编书,还是做其它工作,常常需要制作合成文档,也就是要实现图文并茂的文档.将具有强大绘图功能的AutoCAD软件与Word非常完善的文字处理软件相结合,就能很方便地实现合成文档.下面介绍在AutoCAD002、Word2002中的实现过程.  相似文献   

4.
企业之间的竞争主要在于科学技术的竞争,而科学技术的内容及载体大部分都以文档的形式来体现,文档中蕴含了丰富的知识与技术,也蕴含了悠久的历史文化。以中国核动力研究设计院二所科技信息文档管理为例,从科技文档、人事文档、文书文档、财务文档、设备采购文档几个方面出发,阐述了做好新时期企业文档管理工作的对策。  相似文献   

5.
软件文档的编制方法研究   总被引:2,自引:0,他引:2  
针对当前软件企业在编制文档中所存在的问题,结合软件工程理论,构建了一个符合软件企业实际的文档自动化编制工具,以求解决软件企业的文档重用,规范文档编制和文档管理,改进软件产品质量。  相似文献   

6.
提出了一种自底向上和自顶向下相结合的定位英文科技文档图像中数学表达式的新方法.首先,利用整幅图像的统计数据计算出用于分类的基准参数,然后利用局部极大成分的水平投影数据进行初步行分割,再利用每行的竖直投影数据将每行的符号分成数个子区域.对每一个子区域依据其性质利用基准参数进行分类,通过对特定类别子区域的适当合并,最终得到文档图像中公式的位置.新方法可以用于处理图文混排的文档图像,能够降低文档中的图片、表格等元素对于公式定位结果的影响.  相似文献   

7.
介绍了软件文档的作用、分类及其质量要求,并提出了在软件文档管理和维护中应注意的问题.  相似文献   

8.
科技管理部门的申报与审批工作较多,利用智能文档建立电子化申报与审批中心,可以大大提高办公效率,增加工作的透明度,实现科技管理工作的现代化.  相似文献   

9.
在用J2EE(java 2 enterprise edition)模式进行软件开发过程中,EJB(enterprise java bean)是最核心技术,会生成大量的bean,同时也会生成许多技术文档,如:测试报告、每个Bean的描述文档等.这些Bean和文档对于软件的维护、修改、移植、二次开发和版本更新都是必不可少的,可以避免软件开发单位的损失.Bean和软件技术文档管理工具正是对Bean和软件技术文档进行规范的、有效的管理,并使之具有权威性和共有性,大大提高了软件开发的效率,降低了软件维护的成本,提高了软件的重用性.  相似文献   

10.
中文Web文档全文检索系统的设计及实现   总被引:10,自引:0,他引:10  
为解决在检索某些词时发生漏检或错检,以及查全率和查准率不高的问题,研究字索引技术在中文Web文档检索中的应用.着重讨论字索引组织结构和检索方法,并引入了字节对齐的索引压缩方法,最后描述了一个中文Web文档全文检索系统的结构和实现.测试表明,该系统在响应时间和查准率方面性能均比较好,具有一定的实用性.  相似文献   

11.
在计算机软件产品日新月异的今天,只有在软件项目开发中建立软件工程化标准及每个阶段建立与之相对应的软件文档,才能克服软件开发和维护过程中所遇到的一系列严重问题,开发出高质量的软件产品,并举软件文档写作案例加以说明.  相似文献   

12.
文档数据库的兴起是由于组织管理和搜索完整文档的需求.传统的关系数据库在Internet应用方面和处理多媒体信息方面有许多限制和不足,文档数据库因此应运而生.概要地讨论了文档数据库的基本概念,阐述了文档数据库在Internet数据库构建方面具有的优势,从数据格式、数据库结构和Interne数据库方案三个方面比较了文档数据库与关系数据库的异同.  相似文献   

13.
XML Paperspecification(XPS)文档是微软新一代基于XML和.NET Framework3.0的文档格式.作为一种与PDF作用类似的文档格式,要想浏览XPS文档,需要Windows中安装有.NETFramework3.0和IE7或下载安装微软发布的文档阅读器。为了实现平台无关性,需要对XPS文档源码进行解析和重组。本文旨在研究开发具有自主知识产权的XPS文档阅读器。  相似文献   

14.
徐萍  李振玲 《科技信息》2011,(18):I0366-I0366
美国Adobe公司开发的AdobeAcrobat软件具有强大的文档制作功能,可以很大程度满足图书馆文献传递工作的需要。文章认为在配备一定扫描硬件设备的条件下,图书馆可以充分利用AdobeAcrobat软件的强大功能,来提高文献传递服务的质量与效率。  相似文献   

15.
基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.  相似文献   

16.
为进行文档碎片取证调查,提出了一个文档碎片取证分析模型.该模型扩展了现有的文档碎片取证过程,并将不同抽象层次的文档碎片数据引入该模型.同时将扩展的可信计算技术应用于该模型,解决了文档碎片取证过程中证据链保全机制.对该模型的取证能力进行了评价.通过案例分析,该模型具有较强的文档碎片取证能力并能够进行分布式取证分析.  相似文献   

17.
对于小型企业而言,由于业务量小或业务单一,软件项目的研发往往采用自行开发手段或与开发人员合作共同开发的方式,在软件开发过程中,随意性较大,缺乏规范管理,特别是对文档管理的忽视,常常给项目的实施和维护带来诸多困难。小型企业的软件项目应重视项目的文档管理,保证系统能够正常安装、使用,方便日后的维护。  相似文献   

18.
当今流行的VBA是使OFFICE应用程序自动化的开发工具,它具有广泛而独到的用途。本文简要介绍了用VBA开发文档管理程序的一般方法和步骤,并应用这种方法开发了一个对文档的属性进行自动处理的文档管理程序。  相似文献   

19.
基于文档构件化技术的文档创作是提高文档生产率和文档质量的一条有效途径,可复用文档构件技术是使文档更加成熟的关键点.首先介绍了有关知识管理的相关知识,体现出对知识管理中显性知识———文档进行管理的充要性,并提出文档构造过程中存在的大量重复劳动的问题,提出了基于软件构件与复用理念的构造方式,接着,本文基于XML语言,对“文档构件化”过程中关键部分进行了定义、抽象、Schema设计、解析与组成分析,以及后期的构件存储分析,把文档构件归纳为3类主要构件,并对这3类构件的应用进行了设计.最后,以特殊领域文档为应用实例,设计出实现文档构件化与复用的文档构造模块.  相似文献   

20.
Docbook是一种优秀的可将文件内容与文件样式信息分开处理的文件规范.Docbook提供了单一的源文件维护及版本控制,讨论了一种通过将非规范的XML和HTML文件转换为Docbook规范的文档,然后将Docbook规范文档转换为多种格式的文档,来实现一种更高效并具有扩展性和容错性的文档处理机制。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号