Chinaunix首页 | 论坛 | 博客
  • 博客访问: 507376
  • 博文数量: 158
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 904
  • 用 户 组: 普通用户
  • 注册时间: 2016-10-10 11:17
文章分类

全部博文(158)

文章存档

2018年(74)

2017年(84)

我的朋友

分类: Java

2018-02-02 14:51:58

1、什么是Apache POI?

     Apache POI是一个流行的API,使用程序创建,修改和显示MS-Office文件。 它是由Apache Software Foundation开发和发布的一个开源库,用于使用Java程序设计或修改MS-Office文件。 它包含用于将用户输入数据或文件解码为MS-Office文档的类和方法。

2、Apache POI的组件

   Apache POI包含用于MS-Office的所有OLE2复合文档的类和方法。 此API的组件列表如下:

  • POIFS:此组件是所有其他POI元素的基本因素。 它用于显式读取不同的文件。

  • HSSF:用于读取和写入.xls格式的MS-Excel文件。

  • XSSF(XML SpreadSheet格式):用于MS-Excel的.xlsx文件格式。

  • HPSF:用于提取MS-Office文件的属性集。

  • HWPF:用于读取和写入MS-Word的.doc扩展文件。

  • XWPF(XML字处理器格式):用于读取和写入MS-Word的扩展文件 .docx 。

  • HSLF:用于阅读,创建和编辑PowerPoint演示文稿。

  • HDGF(Horrible DiaGram格式):它包含MS-Visio二进制文件的类和方法。

  • HPBF(Horrible PuBlisher格式):用于读取和写入MS-Publisher文件。

   本文章将指导您完成使用Java处理MS-Word文件的过程。因此,仅限于HWPF和XWPF组件。

3、安装Apache POI库

     从  下载最新版本的Apache POI。并将其内容解压缩到一个文件夹,从中可以将所需的库链接到Java程序。导入jar如下:

image001.jpg

image002.jpg

4、Apache POI Word - 文件

     以下简单程序用于创建空白MS-Word文档:

image003.jpg

image004.jpg

image005.jpg

5、Apache POI Word - 段落

      下面程序用于创建一个段落以及将其添加到文档中。段落是Word文件中页面的一部分。

首先创建一个文档,然后我们可以创建一个段落。使用Paragraph实例,您可以创建行,然后向文档中输入一些文本。例子如下:

image006.jpg

    在c盘根目录下创建word文档:

image007.jpg

    createparagraph.docx 文件如下所示

image008.jpg

6、Apache POI Word - 表格

     下面程序用于创建表格 并且设置表格的宽度,使用XWPFTable 类创建表数据。 将每个行添加到表格中,并将单元格添加到行

image009.jpg

image010.jpg

image011.jpg

image012.jpg

7、Apache POI Word - 图片

     下面程序用与在文档中创建数据表,并向文档中导入图片。

image013.jpg

image014.jpg

image015.jpg

8、Apache POI Word - 文本提取

      对于.docx文件,我们使用类org.apache.poi.xwpf.extractor.XPFFWordExtractor从Word文件中提取和返回简单数据,从Word文件中提取标题,脚注,表数据等。

下面显示如何从Word文件提取简单文本:

image016.jpg

阅读(1203) | 评论(0) | 转发(0) |
0

上一篇:Python调用java

下一篇:Citrix应用分层解析

给主人留下些什么吧!~~