共查询到20条相似文献,搜索用时 15 毫秒
1.
在分析PDF文档和Web数据库进行双向数据传递机理的基础上,对如何利用PDF文档结合ASP技术开发网络学习资源进行了探讨,指出PDF文档集多媒体信息于一身,交互方式丰富,并且可在Web上发布和传递,因此具有独特的优势。 相似文献
2.
3.
在编制一些 HTML页面脚本时 ,我们常常需要部分站点允许访问非 HTML 格式的文档 ,比如Adobe PDF、Microsoft Word和 Microsoft Excel等等。笔者将以 Adobe PDF文档为例 ,介绍如何使用 JAVA语言向 Web客户端发送非 HTML格式文档的方法 相似文献
4.
基于PDF项目文档管理系统的设计与实现 总被引:3,自引:0,他引:3
目的设计一种基于.NET平台和PDF智能文档的开放式项目文档管理系统。方法通过分析基于PDF的项目文档管理系统的结构,在.NET平台下使用组件技术和PDF表单技术实现了基于PDF的项目文档管理系统。结果重点论述了PDF表单图形图像控件的实现、PDF文档内容的搜集、非PDF格式文档的转换等关键技术。通过在某企业的实际应用,验证了系统的功能。结论对提高项目管理水平和企业信息化发展具有较大的价值。 相似文献
5.
随着Web的爆炸性增长,更精确的内容检索受到广泛关注.文档的语义信息提取是内容检索中的关键问题.Tika是近年来出现的一个用来获取文档语义的一个工具软件,支持HTML、PDF、word、PPT、mht等众多格式的文档语义提取.给出了用Tika实现文档元信息提取以及文档内容提取的编程调用方法;分析了Tika进行语义提取中的一些缺陷,并针对文档标题的提取处理给出了纠正解决方案,从而为基于语义的资源检索和全文内容检索提供更为准确的信息表达. 相似文献
6.
丁振凡 《井冈山大学学报(自然科学版)》2013,(2):60-64
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。 相似文献
7.
基于XML的PDF文档认证和完整性保护的实现 总被引:1,自引:0,他引:1
PDF文档已经成为了网络传输的通用文件格式,其认证和完整性保护始终是个难题,最重要的原因是常用的图像认证和完整性保护方法无法在PDF文档中发挥作用。XML是适用于描述文件结构和内容的工具,所以,对PDF文档的内容提取、数据挖掘和信息过滤等操作将完全转移到对XML文档的操作,最终实现了PDF文档认证和完整性保护。 相似文献
8.
《云南大学学报(自然科学版)》2011,33(Z2):107-110
针对传统编校过程中编辑部与作者进行交互时存在的问题,提出了使用北大方正系统来将编校中的校样稿转成PDF文档,并将PDF文档通过电子邮件发给作者进行校对的方法.详细介绍了在编校中如何使用Acrobat及Foxit软件对PDF文档进行注释、批注.经实践证明,对提高编校质量有一定的应用价值. 相似文献
9.
针对PDF 文档的脚注识别问题, 提出一种自动识别脚注及其引用, 并建立它们之间匹配关系的方法。首先针对PDF 文档提取脚注的一系列特征, 包括页面布局、字体信息、语义信息等, 然后基于文档部件风格一致性, 利用聚类技术, 处理在不同文档中相异但在同一文档中相似的特征, 从而使得识别过程能够适应不同文档类型。此外, 利用脚注与引用的匹配结果为识别过程提供反馈, 进一步提高了识别准确性。在真实文档测试集上的实验结果表明, 所提方法对于PDF 文档的脚注识别取得较高的准确率和召回率。 相似文献
10.
编程直接生成PDF文档的方法与实现 总被引:4,自引:0,他引:4
本文通过讨论PDF的文件结构介绍了如何在编程中实现将数据查询结果或数据源的内容以PDF文档格式进行电子发布,以及如何在文档中定叉字体、页面、添加书签、超链接等技巧,并给出了Delphi的实例程序。 相似文献
11.
PDF文档与WEB网页有很大的差别,虽然其结构更复杂,但通常都有明确的标题、摘要和关键词等信息.重点研究如何利用WEB技术获取这些信息并利用它们对PDF文档中的图像进行索引,对其中的几种算法进行说明. 相似文献
12.
PDF文档是目前常用的文档格式,本文介绍了一款小巧、简单易用的PDF文档阅读器,说明了其使用方法,并与传统的AdobeAcrobatReader加以比较. 相似文献
13.
用于PDF文档认证的数字水印算法 总被引:6,自引:0,他引:6
针对网络环境中多媒体数据信息的真实性和完整性认证问题,通过分析PDF页面描述操作符的工作机理,给出了一种适用于PDF文档认证的数字水印算法,将PDF文档字符码的特征信息嵌入到文档字符间距中,检测时通过比较PDF文档的水印信息与字符码特征是否一致来判断文档的真伪。实验结果表明,采用该算法实现的水印不仅具有良好的视觉透明性,还有较强的检错及差错定位能力。 相似文献
14.
为了提高PDF文档的安全性,提出了一种基于置乱技术的适用于PDF文档的文本数字水印算法.首先,将水印图像进行置乱变换;其次,将原PDF文档转换成PS文件.利用PS文件中字符间距值来嵌入水印图像信息,同时将水印位置信息嵌入特定位置;最后,将PS文件转换为含有水印的PDF文档. 相似文献
15.
Adobe Acrobat软件在多媒体教学中的应用 总被引:1,自引:0,他引:1
计算机与网络的普及,大量电子版书籍、学术论文以及相关文件等资源均以PDF文件为主流的电子图书格式存储于互联网之中,其丰富的资源系统是多媒体教学素材参考的最佳选择。文章阐述了PDF文件格式的优势、PDF文档在教学中的应用以及多种应用程序文档的转换等功能。 相似文献
16.
PDF文档具有良好的移植性且应用广泛,常被用作恶意代码的载体。PDF文档具有严格的格式校验,对结构复杂的PDF阅读器进行模糊测试时,传统随机模糊测试效率较低。现有基于文件格式的灰盒模糊测试,由于模型描述语言能力不足,难以针对某种文件格式构建统一的数据模型。该文针对PDF阅读器字体解析引擎提出一种批量化构造测试用例的方法。通过对字体文件重构和添加辅助信息方式,构造格式统一的测试用例,对TrueType格式文件构造统一数据模型。在此基础上,开发了模糊测试工具并对20余款PDF阅读器进行了测试,触发了大量崩溃。结果表明:该方法可以有针对性地构造测试用例,并有效地挖掘PDF阅读器中的缺陷。 相似文献
17.
周朝晖 《科技情报开发与经济》2011,21(16):130-133
Adobe PDF是学术交流和行政文件中应用最广泛的一种文档格式。介绍了无障碍的概念和PDF无障碍的4个层次,并根据最广泛的既定标准评价PDF文档的无障碍。 相似文献
18.
PDF是Adobe公司开发的电子文件格式。这种文件格式是在Internet上进行电子文档交换和数字化信息传播的理想文档格式:由于PDF对文字、图像的高压缩,PDF的文件尺寸很小,文件浏览不会受到操作系统、网络环境、应用程序版本及字体的限制,适宜网上传输和浏览。它也将成为教育技术媒体新的传媒形式,是教育技术中网上教学的教学资源传媒,由于其具有极强加密性能,使用者不能轻易下载或拷贝,有力地保护教育者的知识产权。 相似文献
19.
为编辑PDF文档中的表格信息,设计一种基于Python平台的,包含文件选取与文件转换两大功能模块的信息提取软件。该软件利用Python内置库,针对PDF中不同表格的结构设计算法,识别表格内的文字信息与表格结构,将得到的表格结构还原至Word与Excel文档中,文字信息同样复原至对应单元格内。实验表明:开发的软件完整快速地提取了PDF中的表格信息,并将其转化为易于编辑的Excel和Word文档,达到了预期目的;其转换速度与收费软件WPS相当,转换速度明显快于其他免费转换软件;识别精确度与迅捷PDF转换器、Smallpdf等相比有所提高。 相似文献