Chinaunix首页 | 论坛 | 博客
  • 博客访问: 413881
  • 博文数量: 55
  • 博客积分: 2124
  • 博客等级: 大尉
  • 技术积分: 621
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-26 17:39
文章分类
文章存档

2011年(1)

2010年(2)

2009年(32)

2008年(20)

分类: 嵌入式

2009-05-17 10:50:56

因CUBlog编辑器不好用,我已将网志搬迁到CNBLOGS。

最新版的程序请到PDF补丁丁的新网志下载:

http://pdfpatcher.cnblogs.com/

  

0.2.4 2009年10月9日

新增功能:
 更新 PDF 组件库为 iTextSharp 4.1.6。
 导入简易书签文件时,可使用“打开书签”指令,指示是否打开书签。此指令影响后续的所有书签。
 在打开需要打开权限的 PDF 文件时提示输入密码。
 导入书签文件时可强制指定书签为打开或关闭状态,可强制取消书签链接目标的缩放比例。
 导入信息文件时,可强制指定初始页面视图。
修改功能:
 导入简易书签文件时,书签的开闭状态默认改为关闭。
 导入信息文件的链接坐标允许使用负数。

最新版本的程序将在网志上不定期发布。

程序界面如下(界面同0.2.1版):

程序功能
  1. 导出PDF文件的文件属性信息、阅读器设置、页码设置、PDF书签、页面链接等信息为 XML 文件。
  2. 从简易书签文件或 XML 信息文件中导入并修改文件属性信息、阅读器设置、页码设置、PDF书签、页面链接等内容,补丁后生成新的 PDF 文件。
  3. 提取PDF文件中的页面。
  4. 修改PDF文件页面的尺寸(新增)。
  5. 提取PDF文件中的图片(新增)。
更新历史

比0.2.1版新增的功能:

  1. 导入或导出页面的边框和旋转角度设置。
  2. 简易文本书签文件支持全角数字页码或无页码书签(无页码书签将被视为不转到新页面的书签)。
  3. 支持导出 PDF 文件指定页面中的 FlateDecode(PNG,色域为:DeviceRGB、DeviceGray、Indexed DeviceRGB)、CCITTFaxDecode(TIFF)、DCTDecode(JPEG)图片。
  4. 导入书签后,如原 PDF 文档没有指定初始模式,则自动将其指定为显示文档书签。
  5. 提供解析命名位置的功能,便于完整导出书签和页面链接目标位置。修改功能:
  6. 使用“浏览”按钮指定输入文件后,清除导出文件名称避免不慎覆盖上次导出的文件。
    导入的简易书签点击后跳转到所在页面的顶端。
  7. 如信息文件中具有命名位置,则导入与原 PDF 文件已有的同名位置,原 PDF 文件不具有的命名位置则不会导入。
  8. 简易书签指令中的“#”号可用全角“#”号代替,“=”号可用冒号或全角等号代替。(0.2.3)
  9. 信息文件中的“书签”元素可忽略“动作”属性。默认取值为“转到页面”。(0.2.3)

修复错误:

  1. 无法导入没有书签的信息文件。
  2. 在 PDF 文件指定初始页面布局时,无法导出阅读器的初始设置。
  3. 修复了无法导出某些 PDF 文件图片的问题。(0.2.3)
使用须知
  1. 该程序是绿色软件,解压出来后执行 EXE 文件,按界面的提示操作即可(或阅读下面的操作指南)。
  2. 该程序运行时要求计算机上已安装 .NET Framework 2.0 运行环境
  3. 本程序为免费软件,可自由使用。
  4. 在使用前请阅读并同意软件包中的使用许可。
操作指南

制作 PDF 书签或添加 PDF 批注

还是用 Foxit Reader 吧。免费软件,操作非常方便。

现在也可以使用简易书签文件导入 PDF 书签,请见前面的介绍:

  1. 使用 PDF 补丁丁的简易书签导入功能(一)
  2. 使用 PDF 补丁丁的简易书签导入功能(二)
  3. PDF 补丁丁简易书签文件格式介绍

导出 PDF 文档中的信息

步骤如下:

  1. 打开程序,在界面中点击“PDF 原始文件”右边的“浏览”按钮,指定需要导出信息的 PDF 文件。
  2. 点击左边功能列表中的“导出信息”,转到“导出信息页面”。点击“导出信息”按钮,将弹出保存信息文件的对话框。
  3. 在该对话框中为导出信息文件指定一个文件名,点击“确定”按钮。
  4. 程序将加载 PDF 原始文件,并将信息导出到指定的文件。

编辑 PDF 信息文件

导出的 PDF 信息文件是一个 XML 文件,可采用文本编辑器或 XML 编辑器编辑。您可以通过编辑该信息文件,然后将其再导入到 PDF 文档中打补丁,从而修改 PDF 文档的阅读器设置、书签、批注等内容。由于 XML 文件的内容可以用文本编辑器批量查找替换,因此,可以方便地批量修改某些 PDF 信息(如批量将点击后修改缩放比例的书签修改为不改变缩放比例、将所有文档链接批注的边框颜色改成红色下划线等等)。

关于修改 PDF 信息文档的介绍,请参见接下来的文章。

PDF 信息文件的架构

信息文件是一个 XML 文件,其架构定义如以下 XSD 文件所示(或可参见附图)。

PDF文档信息架构(已包含在上面的程序压缩包中)。

给 PDF 文件打补丁

编辑好 PDF 信息文件后,可以使用此工具给源文件打补丁,生成根据自己需要的新 PDF 文件。步骤如下:

  1. 打开程序,在界面中点击“PDF 原始文件”右边的“浏览”按钮,指定需要打补丁的 PDF 文件。
  2. 点击左边功能列表的“导入信息文件”,转到“导入信息文件”。
  3. 点击导入信息文件功能,点击“用于补丁的信息文件”右边的“浏览”按钮,指定用于打补丁的信息文件。
  4. 点击“导入信息”按钮,将弹出保存打补丁后 PDF 文件的对话框。
  5. 在该对话框中为新的 PDF 文件指定一个文件名,点击“确定”按钮。
  6. 程序将加载 PDF 原始文件和信息文件,利用信息文件修改 PDF 文件后将其导出成为指定的新文件。
无损导出 PDF 文件内的图片
 
步骤如下:
  1. 打开程序,在界面中点击“PDF 原始文件”右边的“浏览”按钮,指定需要导出图片的 PDF 文件。
  2. 点击左边功能列表中的“导出选项”,在选择“高级选项”选项卡中的“导出页面内容”,这时,下面的“将图片导出为独立文件”被激活。
  3. 点击功能列表的“导出信息”,转到对应页面。
  4. 点击“导出信息”按钮,将弹出保存对话框。
  5. 在该对话框中为信息文件指定一个文件名,点击“确定”按钮。
  6. 程序将加载 PDF 原始文件,导出一个信息文件,并在信息文件所在目录创建一个“图片文件”目录,在该目录中保存 PDF 文件提取出来的图片。
  7. 如果你不需要上一步骤导出的信息文件,可将该文件删除。
阅读(18437) | 评论(23) | 转发(0) |
给主人留下些什么吧!~~

wmjordan2010-11-21 23:21:30

楼上提的建议不错,不过中短期内看来均难以实现。抱歉。

chinaunix网友2010-11-21 13:25:52

1. 搞个多国语言版出来吧, 比如至少英文版的; 2. 所有这些修改, 都是用打补丁的形式来做的, 我看到过Infix PDF Editor, 可以直接像Acrobat /reader一样, 直接打开PDF文件, 然后, 像在word里面编辑一样, 对任意相关项目进行修改, 这样教程就好做了, 你甚至可以搞个商品化的共享版出来了; 3. 尝试过Solid PDF converter吗? 要是可以进行PDF到Excel, Word, WPS之类的格式转换, 甚至, 有个PDF打印机, 就更加厉害了.

chinaunix网友2010-11-02 16:53:00

楼主的的确是个好方法 也可以用 pdfdo。这个在线网站,可以实现提取页面,和PDF解密去除限制。 http://www.pdfdo.com/pdf-extract-page.aspx 提取页面 http://www.pdfdo.com/pdf-remove-restriction.aspx 解密去除限制

wmjordan2010-03-23 16:05:22

如果文档使用 Adobe 9.0 的方式加密,现在的处理组件无法解除密码,就导不出书签。只好能组件升级了之后才能处理了。

dongfanglu2010-03-19 21:11:30

对于禁止复制的文档到不出书签