java

关注公众号 jb51net

关闭
首页 > 软件编程 > java > Java poi excel导入

Java使用poi实现excel的导入操作指南

作者:小就是我

使用Apache Poi是一种流行且广泛使用的方式,可以帮助开发人员直接从Java代码中读取、写入和处理Excel文件,因此在这篇文章我们将着重介绍如何实现excel的导入,感兴趣的朋友可以跟着小编一起来学习

创建项目测试

1 创建springBoot项目

2 pom导入相关依赖

 <!--导入依赖jar包-->
 <!--xls(03)-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>3.9</version>
</dependency>
 <!--xlsx(07)-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.9</version>
</dependency>
 <!--日期格式化工具-->
<dependency>
    <groupId>joda-time</groupId>
    <artifactId>joda-time</artifactId>
    <version>2.10.1</version>
</dependency>
 <!--单元测试-->
<dependency>
    <groupId>junit</groupId>
    <artifactId>junit</artifactId>
    <version>4.12</version>
</dependency>

3 本地创建两个excel 分别是03版和07版

首先03版,它最多有65536行

但是07版的,是没有限制的

他们对应的后缀也是不一样的,03版本的xls,07版本的是xslx,这意味着操作它们的工具类也不相同.03版本用的是poi,07版用的则是poi-ooxml

4 Java的宗旨就是万物皆对象,我们也要把excel当成我们的一个对象去处理

1 工作薄

首先我们打开的excel就是一个大对象,也叫工作簿,它包括以下内容

2 工作表

每一个sheet也是我们excel对象的属性,也叫工作表,我们肯定是现有工作簿才会有工作表,而且会默认自带sheet,也可以根据我们的需要自行添加sheet工作表

3 行

excel中有很多行,每一行也是我们excel对象的属性(横的叫行,竖的叫列)

4 列

excel中有很多列,每一列也是我们excel对象的属性(横的叫行,竖的叫列)

5 单元格

一行一列有很多个单元格,每一个单元格也是我们excel对象的属性

创建我们的测试类,创建Workbook对象,按着ctrl点进去发现它是一个接口

点击箭头可以看到它的三个实现类

定义工作簿,工作表,行列,单元格,和我们手动创建excel是一样的操作,只不过是用代码来实现

03版本excel IO操作写的全部代码如下

package com.wyh.Test;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.joda.time.DateTime;
import org.junit.Test;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.util.Date;
 /**
 *  @program:  JavaExecl
 *  @description:  写excel 03版本
 *  @author:  魏一鹤
 *  @createDate:  2021-12-12 10:42
 **/
public class ExcelWrite03 {
    //全局路径,供我们操作使用方便
  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;
    @Test
    public  void ExcelWrite03() throws Exception {
        //1创建一个工作簿
 Workbook workbook=new HSSFWorkbook();
        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建
 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作
 Sheet sheet=workbook.createSheet( "用户表" );
        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建
 //默认从0开始 也就是第一行
 Row row1 = sheet.createRow(0);
        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)
 Cell cell11 = row1.createCell(0);
        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)
 Cell cell12 = row1.createCell(1);
        //给单元格赋值
 cell11.setCellValue( "姓名" );
        cell12.setCellValue( "魏一鹤" );
        //创建第二行
 Row row2=sheet.createRow(1);
        //创建第二行的第一列
 Cell cell21 = row2.createCell(0);
        Cell cell22 = row2.createCell(1);
        //给单元格赋值(2.1)
 cell21.setCellValue( "出生日期" );
        //创建时间并且格式化
 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );
        //给单元格赋值(2.2)
 cell22.setCellValue(s);
        //生成一张表 其实就是IO流操作 03版本就是使用xls文件结尾
 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试03.xls" );
        //输出工作簿
 workbook.write(fileOutputStream);
        //关闭流
 fileOutputStream.close();
        System.out.println( "用户测试03.xls生成完毕" );
    }
}

07版本excel IO操作写的全部代码如下

package com.wyh.Test;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.joda.time.DateTime;
import org.junit.Test;
import java.io.FileOutputStream;
 /**
 *  @program:  JavaExecl
 *  @description:  07版本excel写操作
 *  @author:  魏一鹤
 *  @createDate:  2021-12-12 23:58
 **/
public class ExcelWrite07 {
    //全局路径,供我们操作使用方便
  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;
    @Test
    public  void ExcelWrite07() throws Exception {
        //07版和03最大的差别就是使用的工具不一样 03是HSSF 07是XSSF
 //其他代码无需改动
 //1创建一个工作簿
 Workbook workbook=new XSSFWorkbook();
        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建
 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作
 Sheet sheet=workbook.createSheet( "用户表" );
        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建
 //默认从0开始 也就是第一行
 Row row1 = sheet.createRow(0);
        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)
 Cell cell11 = row1.createCell(0);
        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)
 Cell cell12 = row1.createCell(1);
        //给单元格赋值
 cell11.setCellValue( "今日学习" );
        cell12.setCellValue( "api和easyExcl导出导入excel" );
        //创建第二行
 Row row2=sheet.createRow(1);
        //创建第二行的第一列
 Cell cell21 = row2.createCell(0);
        Cell cell22 = row2.createCell(1);
        //给单元格赋值(2.1)
 cell21.setCellValue( "学习日期" );
        //创建时间并且格式化
 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );
        //给单元格赋值(2.2)
 cell22.setCellValue(s);
        //生成一张表 其实就是IO流操作 07版本就是使用xlsx文件结尾
 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试07.xlsx" );
        //输出工作簿
 workbook.write(fileOutputStream);
        //关闭流
 fileOutputStream.close();
        System.out.println( "用户测试07.xls生成完毕" );
    }
}

运行后发现,会在项目本地生成我们定义的excel,打开查看

03版和07版的区别如下:

1 03版本有最大长度现在 07版本没有

2 03版本后缀xls 07版本后缀xlsx

3 03版本使用的工具是HSSF,07版本使用的是XSSF

5 大数据绕导入导出(批量)

真实开发中,大多数就是大数据批量导入或者导出excel

大文件写HSSF

缺点:最多只能处理65536行,否则会报内存溢出异常

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

大文件写XSSF

缺点:写数据时速度非常慢,非常消耗内存,也会发生内存溢出,比如100万条

优点:可以写较大的数据量,比如20万条

03版本HSSF循环导入65536行数据(03版本最大行就是65536)

03版本HSSF循环插入65536条

package com.wyh.Test;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.junit.Test;
import java.io.FileOutputStream;
 /**
 *  @program:  JavaExecl
 *  @description:  大数据量写03版本
 *  @author:  魏一鹤
 *  @createDate:  2021-12-14 23:31
 **/
public class BigDateExcelWrite03 {
    //全局路径,供我们操作使用方便
  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;
    @Test
    public void BigDateExcelWrite03() throws Exception {
        //开始时间 用于计算时间差
  long beginTime = System.currentTimeMillis();
        //创建工作簿  03版本使用HSSF
 Workbook workbook = new HSSFWorkbook();
        //创建工作表 这里就不给它命令了 按照默认的来
 Sheet sheet = workbook.createSheet();
        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行
  for (int rowNum = 0; rowNum < 65536; rowNum++) {
            //循环创建行
 Row row = sheet.createRow(rowNum);
            for(int cellNum=0;cellNum<10;cellNum++){
                //循环插入列
 Cell cell = row.createCell(cellNum);
                //循环设置值
 cell.setCellValue(cellNum);
            }
        }
        System.out.println( "生成excel表完毕" );
        //03版本的后缀是xls
 //开启文件流
 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite03.xlsx" );
        //开始写excel
 workbook.write(fileOutputStream);
        //关闭流
 fileOutputStream.close();
        //结束时间
  long endTime = System.currentTimeMillis();
        //输出花费的时间
 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);
    }
}

运行发现excel已经创建成功,速度也非常的快

打开查看

已知03版本xls最多存65536行,那么如果我们循环插入65537行会怎么样呢? 保留源代码,循环最大值设置为65537

再次运行发现会报错

java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

07版本XSSF循环插入65536条

把后缀改为xlsx,把HSSF缓存XSSF即可

package com.wyh.Test;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.junit.Test;
import java.io.FileOutputStream;
 /**
 *  @program:  JavaExecl
 *  @description:  大数据量写03版本
 *  @author:  魏一鹤
 *  @createDate:  2021-12-14 23:31
 **/
public class BigDateExcelWrite07 {
    //全局路径,供我们操作使用方便
  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;
    @Test
    public void BigDateExcelWrite07() throws Exception {
        //开始时间 用于计算时间差
  long beginTime = System.currentTimeMillis();
        //创建工作簿 07版本的使用XSSF
 Workbook workbook = new XSSFWorkbook();
        //创建工作表 这里就不给它命令了 按照默认的来
 Sheet sheet = workbook.createSheet();
        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行
  for (int rowNum = 0; rowNum < 65536; rowNum++) {
            //循环创建行
 Row row = sheet.createRow(rowNum);
            for(int cellNum=0;cellNum<10;cellNum++){
                //循环插入列
 Cell cell = row.createCell(cellNum);
                //循环设置值
 cell.setCellValue(cellNum);
            }
        }
        System.out.println( "生成excel表完毕" );
        //037版本的后缀是xlsx
 //开启文件流
 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07.xlsx" );
        //开始写excel
 workbook.write(fileOutputStream);
        //关闭流
 fileOutputStream.close();
        //结束时间
  long endTime = System.currentTimeMillis();
        //输出花费的时间
 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);
    }
}

虽然也运行成功,但是可以明显感觉到速度不如03版HSSF,但是可以存更多的数据

打开excel查看发现数据到了65536停并没有结束,说明07版本XSSF上限不是65536,是可以存储更多的,可以写更多的数据

如果我们正在查看同一个文件,但是又进行其他操作,就会出现以下错误,我们把我们正在查看的文件关闭让它运行,等运行结束后再次打开即可

java.io.FileNotFoundException: D:\Tools\JavaWorkSpace\JavaExecl\BigDateExcelWrite07.xlsx (另一个程序正在使用此文件,进程无法访问。)

07版本XSSF导入100000条数据,把循环数改为100000即可

既然XSSF可以存这么多数据,但是速度比较慢,有没有方法可以优化效率呢(缓存,这个问题也可以叫做如何给poi加速

它就是Workbook借口三个实现类之一的SXSSFWorkbook,其他的两个我们上面都有操作过

这时候需要用到我们的SXSSF

优点:可以写非常大的数据量.如100万条甚至更多,写速度非常快,占用更少的

注意

1 过程中会产生临时文件,需要清理临时文件

2 默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件,当然缓存数量也可以自定义

3 如果自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

SXSSF循环插入100000条数据

package com.wyh.Test;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.junit.Test;
import java.io.FileOutputStream;
 /**
 *  @program:  JavaExecl
 *  @description:  大数据量写03版本
 *  @author:  魏一鹤
 *  @createDate:  2021-12-14 23:31
 **/
public class BigDateExcelWrite07Super {
    //全局路径,供我们操作使用方便
  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;
    @Test
    public void BigDateExcelWrite07Super() throws Exception {
        //开始时间 用于计算时间差
  long beginTime = System.currentTimeMillis();
        //创建工作簿 07版本的使用XSSF
 Workbook workbook = new SXSSFWorkbook();
        //创建工作表 这里就不给它命令了 按照默认的来
 Sheet sheet = workbook.createSheet();
        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行
  for (int rowNum = 0; rowNum < 100000; rowNum++) {
            //循环创建行
 Row row = sheet.createRow(rowNum);
            for(int cellNum=0;cellNum<10;cellNum++){
                //循环插入列
 Cell cell = row.createCell(cellNum);
                //循环设置值
 cell.setCellValue(cellNum);
            }
        }
        System.out.println( "生成excel表完毕" );
        //037版本的后缀是xlsx
 //开启文件流
 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07Super.xlsx" );
        //开始写excel
 workbook.write(fileOutputStream);
        //关闭流
 fileOutputStream.close();
        //由于SXSSF会产生临时文件,这里我们需要清除下临时文件
 ((SXSSFWorkbook) workbook).dispose();
        //结束时间
  long endTime = System.currentTimeMillis();
        //输出花费的时间
 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);
    }
}

运行发现,excel也正常生成了,但是它(SXSSF)的速度比XSSF快的多

查看我们的super

这就是我们的临时文件,随着我们把文件的关闭,临时文件也会随之消失

以上就是Java使用poi实现excel的导入操作指南的详细内容,更多关于Java poi excel导入的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文