Chinaunix首页 | 论坛 | 博客
  • 博客访问: 164928
  • 博文数量: 56
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 593
  • 用 户 组: 普通用户
  • 注册时间: 2014-02-18 09:59
文章分类

全部博文(56)

文章存档

2019年(1)

2018年(26)

2016年(1)

2015年(6)

2014年(22)

我的朋友

分类: Java

2018-06-29 16:23:10




点击(此处)折叠或打开

  1. import org.apache.pdfbox.pdmodel.PDDocument;
  2. import org.apache.pdfbox.text.PDFTextStripper;
  3. import org.slf4j.Logger;
  4. import org.slf4j.LoggerFactory;

  5. import java.io.*;

  6. /**
  7.  * Created by xiaojun on 16/1/5
  8.  */
  9. public class PdfReader {

  10.     private static final Logger logger = LoggerFactory.getLogger(PdfReader.class);


  11.     public PdfReader() {
  12.     }

  13.     /**
  14.      * @param file 文件
  15.      * @return 读出的pdf的内容
  16.      */
  17.     public String getTextFromPdf(File file) {
  18.         String result = null;
  19.         PDDocument document = null;
  20.         try {
  21.             document = PDDocument.load(file);
  22.             PDFTextStripper stripper = new PDFTextStripper();
  23.             result = stripper.getText(document);
  24.         } catch (IOException e) {
  25.             logger.error("IOException",e);
  26.         } finally {
  27.             if (document != null) {
  28.                 try {
  29.                     document.close();
  30.                 } catch (IOException e) {
  31.                     logger.error("IOException",e);
  32.                 }
  33.             }
  34.         }
  35.         return result;
  36.     }

  37.     public String getTextFromPdf(InputStream is) {
  38.         String result = null;
  39.         PDDocument document = null;
  40.         try {
  41.             document = PDDocument.load(is);
  42.             PDFTextStripper stripper = new PDFTextStripper();
  43.             result = stripper.getText(document);

  44.         } catch (Exception ex) {
  45.             logger.warn("获取文件内容,getTextFromPdf error",ex);
  46.         } finally {
  47.             if (document != null) {
  48.                 try {
  49.                     document.close();
  50.                 } catch (IOException e) {
  51.                     logger.warn("获取文件内容,getTextFromPdf error",e);
  52.                 }
  53.             }
  54.         }
  55.         return result;
  56.     }
  57. }

阅读(827) | 评论(0) | 转发(0) |
0

上一篇:ftp文件上传

下一篇:NumberUtil 数值工具类

给主人留下些什么吧!~~