2012年(3)
分类: IT职场
2012-11-27 15:23:21
如果你购买了MS Office的相应套件,则可通过MS Office Document Imaging进行PDF到Word的转换。
Microsoft Office Document Imaging 是MS Office的一款选装组件,用于印刷文档的图像化扫描存储,并具有OCR功能。因此,也可以先把PDF虚拟打印为 Microsoft Office Document Imaging 格式 (MDI) ;再通过OCR转为可编辑的Word文档。(官方帮助: )
转载一下操作步骤:
① 从PDF到MDI:在PDF阅读器中,打印PDF,打印机选“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 (注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。 )
② 从MDI到Word:Document Imaging 转换为运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,确认即可。
================================================
网上copy来的数据,原文作者总结很多方法,感觉此方法不需额外安装软件,而且office自带的OCR识别准确度极高。比HW那种图片粘贴、糊弄大众的方法有用!