Java使用poi实现excel的导入操作指南
作者:小就是我
创建项目测试
1 创建springBoot项目
2 pom导入相关依赖
<!--导入依赖jar包--> <!--xls(03)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.9</version> </dependency> <!--xlsx(07)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.9</version> </dependency> <!--日期格式化工具--> <dependency> <groupId>joda-time</groupId> <artifactId>joda-time</artifactId> <version>2.10.1</version> </dependency> <!--单元测试--> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency>
3 本地创建两个excel 分别是03版和07版
首先03版,它最多有65536行
但是07版的,是没有限制的
他们对应的后缀也是不一样的,03版本的xls,07版本的是xslx,这意味着操作它们的工具类也不相同.03版本用的是poi,07版用的则是poi-ooxml
4 Java的宗旨就是万物皆对象,我们也要把excel当成我们的一个对象去处理
1 工作薄
首先我们打开的excel就是一个大对象,也叫工作簿,它包括以下内容
2 工作表
每一个sheet也是我们excel对象的属性,也叫工作表,我们肯定是现有工作簿才会有工作表,而且会默认自带sheet,也可以根据我们的需要自行添加sheet工作表
3 行
excel中有很多行,每一行也是我们excel对象的属性(横的叫行,竖的叫列)
4 列
excel中有很多列,每一列也是我们excel对象的属性(横的叫行,竖的叫列)
5 单元格
一行一列有很多个单元格,每一个单元格也是我们excel对象的属性
创建我们的测试类,创建Workbook对象,按着ctrl点进去发现它是一个接口
点击箭头可以看到它的三个实现类
定义工作簿,工作表,行列,单元格,和我们手动创建excel是一样的操作,只不过是用代码来实现
03版本excel IO操作写的全部代码如下
package com.wyh.Test; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.joda.time.DateTime; import org.junit.Test; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.util.Date; /** * @program: JavaExecl * @description: 写excel 03版本 * @author: 魏一鹤 * @createDate: 2021-12-12 10:42 **/ public class ExcelWrite03 { //全局路径,供我们操作使用方便 static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ; @Test public void ExcelWrite03() throws Exception { //1创建一个工作簿 Workbook workbook=new HSSFWorkbook(); //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作 Sheet sheet=workbook.createSheet( "用户表" ); //3创建行 行也是在我们的表中存在的,所以需要用到表来创建 //默认从0开始 也就是第一行 Row row1 = sheet.createRow(0); //创建单元格 第一行的第一个数据 用坐标表示为(1,1) Cell cell11 = row1.createCell(0); //创建单元格 第一行的第二个数据 用坐标表示为(1,2) Cell cell12 = row1.createCell(1); //给单元格赋值 cell11.setCellValue( "姓名" ); cell12.setCellValue( "魏一鹤" ); //创建第二行 Row row2=sheet.createRow(1); //创建第二行的第一列 Cell cell21 = row2.createCell(0); Cell cell22 = row2.createCell(1); //给单元格赋值(2.1) cell21.setCellValue( "出生日期" ); //创建时间并且格式化 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" ); //给单元格赋值(2.2) cell22.setCellValue(s); //生成一张表 其实就是IO流操作 03版本就是使用xls文件结尾 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试03.xls" ); //输出工作簿 workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); System.out.println( "用户测试03.xls生成完毕" ); } }
07版本excel IO操作写的全部代码如下
package com.wyh.Test; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.joda.time.DateTime; import org.junit.Test; import java.io.FileOutputStream; /** * @program: JavaExecl * @description: 07版本excel写操作 * @author: 魏一鹤 * @createDate: 2021-12-12 23:58 **/ public class ExcelWrite07 { //全局路径,供我们操作使用方便 static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ; @Test public void ExcelWrite07() throws Exception { //07版和03最大的差别就是使用的工具不一样 03是HSSF 07是XSSF //其他代码无需改动 //1创建一个工作簿 Workbook workbook=new XSSFWorkbook(); //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作 Sheet sheet=workbook.createSheet( "用户表" ); //3创建行 行也是在我们的表中存在的,所以需要用到表来创建 //默认从0开始 也就是第一行 Row row1 = sheet.createRow(0); //创建单元格 第一行的第一个数据 用坐标表示为(1,1) Cell cell11 = row1.createCell(0); //创建单元格 第一行的第二个数据 用坐标表示为(1,2) Cell cell12 = row1.createCell(1); //给单元格赋值 cell11.setCellValue( "今日学习" ); cell12.setCellValue( "api和easyExcl导出导入excel" ); //创建第二行 Row row2=sheet.createRow(1); //创建第二行的第一列 Cell cell21 = row2.createCell(0); Cell cell22 = row2.createCell(1); //给单元格赋值(2.1) cell21.setCellValue( "学习日期" ); //创建时间并且格式化 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" ); //给单元格赋值(2.2) cell22.setCellValue(s); //生成一张表 其实就是IO流操作 07版本就是使用xlsx文件结尾 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试07.xlsx" ); //输出工作簿 workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); System.out.println( "用户测试07.xls生成完毕" ); } }
运行后发现,会在项目本地生成我们定义的excel,打开查看
03版和07版的区别如下:
1 03版本有最大长度现在 07版本没有
2 03版本后缀xls 07版本后缀xlsx
3 03版本使用的工具是HSSF,07版本使用的是XSSF
5 大数据绕导入导出(批量)
真实开发中,大多数就是大数据批量导入或者导出excel
大文件写HSSF
缺点:最多只能处理65536行,否则会报内存溢出异常
优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快
大文件写XSSF
缺点:写数据时速度非常慢,非常消耗内存,也会发生内存溢出,比如100万条
优点:可以写较大的数据量,比如20万条
03版本HSSF循环导入65536行数据(03版本最大行就是65536)
03版本HSSF循环插入65536条
package com.wyh.Test; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.junit.Test; import java.io.FileOutputStream; /** * @program: JavaExecl * @description: 大数据量写03版本 * @author: 魏一鹤 * @createDate: 2021-12-14 23:31 **/ public class BigDateExcelWrite03 { //全局路径,供我们操作使用方便 static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ; @Test public void BigDateExcelWrite03() throws Exception { //开始时间 用于计算时间差 long beginTime = System.currentTimeMillis(); //创建工作簿 03版本使用HSSF Workbook workbook = new HSSFWorkbook(); //创建工作表 这里就不给它命令了 按照默认的来 Sheet sheet = workbook.createSheet(); //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行 for (int rowNum = 0; rowNum < 65536; rowNum++) { //循环创建行 Row row = sheet.createRow(rowNum); for(int cellNum=0;cellNum<10;cellNum++){ //循环插入列 Cell cell = row.createCell(cellNum); //循环设置值 cell.setCellValue(cellNum); } } System.out.println( "生成excel表完毕" ); //03版本的后缀是xls //开启文件流 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite03.xlsx" ); //开始写excel workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); //结束时间 long endTime = System.currentTimeMillis(); //输出花费的时间 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000); } }
运行发现excel已经创建成功,速度也非常的快
打开查看
已知03版本xls最多存65536行,那么如果我们循环插入65537行会怎么样呢? 保留源代码,循环最大值设置为65537
再次运行发现会报错
java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)
07版本XSSF循环插入65536条
把后缀改为xlsx,把HSSF缓存XSSF即可
package com.wyh.Test; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.junit.Test; import java.io.FileOutputStream; /** * @program: JavaExecl * @description: 大数据量写03版本 * @author: 魏一鹤 * @createDate: 2021-12-14 23:31 **/ public class BigDateExcelWrite07 { //全局路径,供我们操作使用方便 static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ; @Test public void BigDateExcelWrite07() throws Exception { //开始时间 用于计算时间差 long beginTime = System.currentTimeMillis(); //创建工作簿 07版本的使用XSSF Workbook workbook = new XSSFWorkbook(); //创建工作表 这里就不给它命令了 按照默认的来 Sheet sheet = workbook.createSheet(); //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行 for (int rowNum = 0; rowNum < 65536; rowNum++) { //循环创建行 Row row = sheet.createRow(rowNum); for(int cellNum=0;cellNum<10;cellNum++){ //循环插入列 Cell cell = row.createCell(cellNum); //循环设置值 cell.setCellValue(cellNum); } } System.out.println( "生成excel表完毕" ); //037版本的后缀是xlsx //开启文件流 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07.xlsx" ); //开始写excel workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); //结束时间 long endTime = System.currentTimeMillis(); //输出花费的时间 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000); } }
虽然也运行成功,但是可以明显感觉到速度不如03版HSSF,但是可以存更多的数据
打开excel查看发现数据到了65536停并没有结束,说明07版本XSSF上限不是65536,是可以存储更多的,可以写更多的数据
如果我们正在查看同一个文件,但是又进行其他操作,就会出现以下错误,我们把我们正在查看的文件关闭让它运行,等运行结束后再次打开即可
java.io.FileNotFoundException: D:\Tools\JavaWorkSpace\JavaExecl\BigDateExcelWrite07.xlsx (另一个程序正在使用此文件,进程无法访问。)
07版本XSSF导入100000条数据,把循环数改为100000即可
既然XSSF可以存这么多数据,但是速度比较慢,有没有方法可以优化效率呢(缓存,这个问题也可以叫做如何给poi加速
它就是Workbook借口三个实现类之一的SXSSFWorkbook,其他的两个我们上面都有操作过
这时候需要用到我们的SXSSF
优点:可以写非常大的数据量.如100万条甚至更多,写速度非常快,占用更少的
注意
1 过程中会产生临时文件,需要清理临时文件
2 默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件,当然缓存数量也可以自定义
3 如果自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)
SXSSF循环插入100000条数据
package com.wyh.Test; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.streaming.SXSSFWorkbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.junit.Test; import java.io.FileOutputStream; /** * @program: JavaExecl * @description: 大数据量写03版本 * @author: 魏一鹤 * @createDate: 2021-12-14 23:31 **/ public class BigDateExcelWrite07Super { //全局路径,供我们操作使用方便 static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ; @Test public void BigDateExcelWrite07Super() throws Exception { //开始时间 用于计算时间差 long beginTime = System.currentTimeMillis(); //创建工作簿 07版本的使用XSSF Workbook workbook = new SXSSFWorkbook(); //创建工作表 这里就不给它命令了 按照默认的来 Sheet sheet = workbook.createSheet(); //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行 for (int rowNum = 0; rowNum < 100000; rowNum++) { //循环创建行 Row row = sheet.createRow(rowNum); for(int cellNum=0;cellNum<10;cellNum++){ //循环插入列 Cell cell = row.createCell(cellNum); //循环设置值 cell.setCellValue(cellNum); } } System.out.println( "生成excel表完毕" ); //037版本的后缀是xlsx //开启文件流 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07Super.xlsx" ); //开始写excel workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); //由于SXSSF会产生临时文件,这里我们需要清除下临时文件 ((SXSSFWorkbook) workbook).dispose(); //结束时间 long endTime = System.currentTimeMillis(); //输出花费的时间 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000); } }
运行发现,excel也正常生成了,但是它(SXSSF)的速度比XSSF快的多
查看我们的super
这就是我们的临时文件,随着我们把文件的关闭,临时文件也会随之消失
以上就是Java使用poi实现excel的导入操作指南的详细内容,更多关于Java poi excel导入的资料请关注脚本之家其它相关文章!