Excel文件解析--超大Excel文件读写

使用POI写入

        当我们想在Excel文件中写入100w条数据时,我们用普通的XSSFWorkbook对象写入时会发现,只有在将100w条数据全部加载入内存后才会用write()方法统一写入,这样效率很低,所以我们引入了SXSSFWorkbook进行超大Excel文件的读写。

        SXSSFWorkbook可以通过构造参数来控制:当数据写入内存量达到参数值时,就把这些数据flush到Excel文件中

public class Demo02_SXSSFWorkbook {public static void main(String[] args) {String Path="D://IO流//0421.xlsx";try (Workbook workbook = new SXSSFWorkbook(1000);FileOutputStream out=new FileOutputStream(Path)){//生成SheetSheet sheet=workbook.createSheet();for(int i=0;i<1000000;i++) {Row row =sheet.createRow(i);Cell cell0=row.createCell(0);cell0.setCellValue(UUID.randomUUID().toString());Cell cell1=row.createCell(1);cell1.setCellValue(new Date());}//写入输出流workbook.write(out);}catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}
}

使用EasyExcel写入

        使用EasyExcel,我们首先要导入相关jar包

         这是一个普通的Order类:

public class Order {private String orderId;private Double payment;public Order() {this.orderId=LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddHHmmss"))+UUID.randomUUID().toString().substring(0,5);this.payment=Math.random()*1000;}public String getOrderId() {return orderId;}public void setOrderId(String orderId) {this.orderId = orderId;}public Double getPayment() {return payment;}public void setPayment(Double payment) {this.payment = payment;}@Overridepublic String toString() {return "Order [orderId=" + orderId + ", payment=" + payment + "]";}
}

        然后我们来通过EasyExcel来将100w条数据写入excel文件:

public class Text_order {public static void main(String[] args) {EasyExcel.write("D://IO流//422.xlsx",Order.class).sheet("订单数据").dowrite(creatOrderData());}//生成100w条数据private static List<Order> creatOrderData(){List<Order> orderList=new ArrayList<Order>();for(int i=0;i<1000000;i++) {orderList.add(new Order());}return orderList;}
}

运行结果: 

        我们发现,Order类中的成员变量名就是我们生成的Excel文件中的列头。那么如果我们想自定义列头时,我们可以用:@ExcelProperty("列头名")

public class Order {@ExcelProperty("订单编号")private String orderId;@ExcelProperty("支付金额")private Double payment;public Order() {...}
}

运行结果:

        那么,当我们想加入一列日期数据时:

public class Order {@ExcelProperty("订单编号")private String orderId;@ExcelProperty("支付金额")private Double payment;@ExcelProperty("创建时间")private LocalDateTime  creatTime;public Order() {this.orderId=LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddHHmmss"))+UUID.randomUUID().toString().substring(0,5);this.payment=Math.random()*1000;this.creatTime=LocalDateTime.now();}public String getOrderId() {return orderId;}public void setOrderId(String orderId) {this.orderId = orderId;}public Double getPayment() {return payment;}public void setPayment(Double payment) {this.payment = payment;}public LocalDateTime getCreatTime() {return creatTime;}public void setCreatTime(LocalDateTime creatTime) {this.creatTime = creatTime;}@Overridepublic String toString() {return "Order [orderId=" + orderId + ", payment=" + payment+ ", creatTime=" + creatTime + "]";}
}

运行结果:

通过阅读报错提示(Can not find 'Converter' support class LocalDateTime.) ,我们大概可以知道,是因为找不到一个支持LocalDateTime类的转换器,所以为了解决这个问题,我们可以自己写一个比较器类:

public class LocalDateTimeConverter implements Converter<LocalDateTime> {//Excel文件中的类型@Overridepublic CellDataTypeEnum supportExcelTypeKey() {// TODO Auto-generated method stubreturn CellDataTypeEnum.STRING;}//程序中的类型@Overridepublic Class supportJavaTypeKey() {// TODO Auto-generated method stubreturn LocalDateTime.class;}//将LocalDateTime类型的数据转换成String//并封装到一个Excel文件中的CellData@Overridepublic CellData convertToExcelData(LocalDateTime value,         ExcelContentProperty arg1,GlobalConfiguration arg2)throws Exception {// TODO Auto-generated method stubreturn new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy年MM月dd日 HH:mm:ss")));}//从CellData中获取一个String类型的数据//并转换成LocalDateTime@Overridepublic LocalDateTime convertToJavaData(CellData cellData,             ExcelContentProperty arg1,GlobalConfiguration arg2)throws Exception {// TODO Auto-generated method stubreturn LocalDateTime.parse(				            cellData.getStringValue(),DateTimeFormatter.ofPattern("yyyy年MM月dd日 HH:mm:ss"));}
}

        当我们写好这个比较器后,就需要给成员变量creatTime显示的设置好比较器:

public class Order {@ExcelProperty("订单编号")private String orderId;@ExcelProperty("支付金额")private Double payment;//设置LocalDateTime对应转换器@ExcelProperty(value="创建时间",converter=LocalDateTimeConverter.class)private LocalDateTime  creatTime;public Order() {...}
}

运行结果:

Excel文件解析的应用

案例一:检查Excel文件

//检查demo-data.xlsx文件中的人员信息格式是否正确,具体要求如下:

// 1.序号是否连续
// 2.检查性别是否为男或女
// 3.身份证号
// 3.1 身份证号码格式(必须为18位)
// 3.2 身份证号码不能重复
// 3.3 身份证号码开头两位是否与籍贯符合
// 北京 11 天津12 河北 13 山西14 内蒙古 15
// 陕西61 甘肃62 青海 63
// 4.学历只能填写:大专、本科、硕士、其它
// 5.体重在40-180之间

public class Work01 {public static void main(String[] args) {List<String> errorMsgList=validateDataExcel("D:\\IO流\\demo-    data.xlsx");if(errorMsgList.size()==0){System.out.println("文件检查无误");}else {//显示错误信息for(String err:errorMsgList) {System.out.println(err);}}}public static List<String> validateDataExcel(String path){//创建一个list用于保存错误提示信息ArrayList<String> errorList=new ArrayList<String>();//创建一个set用于检查身份证账号是否重复的集合HashSet<String> idcardNoSet=new HashSet<String>();//创建一个HashMap用于检查身份证号码开头两位是否与籍贯符合HashMap<String,String> provinceMap=new HashMap<String,String>(){//匿名构造代码块{put("11","北京");put("12","天津");put("13","河北");put("14","山西");put("15","内蒙古");put("61","陕西");put("62","甘肃");put("63","青海");}};//创建一个用于检查学历的listList<String> eduList=Arrays.asList("大专","硕士","本科","其他");try(Workbook workbook=new XSSFWorkbook(path)){Sheet sheet=workbook.getSheetAt(0);//获取每个Cell中的数据for(int i =1;i<sheet.getLastRowNum();i++){//1.序号是否连续Cell cellId=row.getRow(0);//通过当前行数获取正确的序号int rowNum=row.getRowNum();//获取文件中的序号int id=(int)cellId.getNumericCellValue();if(rowNum!=id) {errorList.add(String.format("%d行的数据不连续",rowNum));		}//2.检查性别是否为男或女String gender =row.getCell(2).getStringCellValue();if(!ender.equals("男")&&!ender.equals("女")){errorList.add(String.format("%d行的性别有误",rowNum));}// 3.身份证号String idCardNo=row.getCell(3).getStringCellValue();// 3.1 身份证号码格式(必须为18位)if(idCardNo.length()!=18) {errorList.add(String.format("%d行的身份证号码长度有误",rowNum));}// 3.2 身份证号码不能重复//如果成功添加进idcardNoSet集合,说明该身份证号没有重复//如果添加不成功,代表有重复if(!idcardNoSet.add(idCardNo)){errorList.add(String.format("%d行的身份证号码重复",rowNum));}// 3.3 身份证号码开头两位是否与籍贯符合// 北京 11 天津12 河北 13 山西14 内蒙古 15// 陕西61 甘肃62 青海 63String idCardNoHomeCode=idCardNo.substring(0,2);//根据身份证号码前两位,在provinceMap中获取正确的籍贯省份名称String homeValue=provinceMap.get(idCardNoHomeCode);// 获取表格中当前行的籍贯省份String home=row.getCell(6).getStringCellValue();if(homeValue!=home) {errorList. add(String. format("%d行的身份证籍贯信息不一致! ", rowNum));}// 4.学历只能填写:大专、本科、硕士、其它//通过在eduList列表中查找来判断学历信息是否符合规范String eduValue = row.getCell(7). getStringCellValue();if(!eduList.contains(eduValue)) {errorList. add(String. format("%d行的学历信息不符合规范! ", rowNum));}}} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}return errorList;}}

运行结果:

1行的身份证籍贯信息不一致! 
1行的学历信息不符合规范! 
2行的身份证籍贯信息不一致! 
3行的身份证籍贯信息不一致! 
4行的数据不连续
4行的身份证籍贯信息不一致! 
5行的身份证籍贯信息不一致! 
5行的学历信息不符合规范! 
6行的身份证籍贯信息不一致! 
7行的身份证号码长度有误
7行的身份证籍贯信息不一致! 
8行的身份证籍贯信息不一致! 
9行的身份证号码长度有误
9行的身份证籍贯信息不一致! 
9行的学历信息不符合规范! 
10行的身份证籍贯信息不一致! 
11行的身份证号码长度有误
11行的身份证籍贯信息不一致! 
12行的数据不连续
12行的身份证籍贯信息不一致! 
13行的身份证号码长度有误
13行的身份证籍贯信息不一致! 
14行的身份证籍贯信息不一致! 
14行的学历信息不符合规范! 
15行的身份证籍贯信息不一致! 
15行的学历信息不符合规范! 
16行的性别有误
16行的身份证籍贯信息不一致! 
17行的身份证籍贯信息不一致! 
18行的数据不连续
18行的身份证籍贯信息不一致! 
19行的身份证籍贯信息不一致! 
20行的身份证籍贯信息不一致! 
21行的身份证籍贯信息不一致! 
22行的身份证籍贯信息不一致! 
23行的身份证籍贯信息不一致! 
24行的身份证号码重复
24行的身份证籍贯信息不一致! 
25行的性别有误
25行的身份证籍贯信息不一致! 
26行的身份证籍贯信息不一致! 
27行的身份证籍贯信息不一致! 
28行的身份证籍贯信息不一致! 
29行的身份证籍贯信息不一致! 
30行的身份证籍贯信息不一致! 
31行的身份证籍贯信息不一致! 
32行的身份证籍贯信息不一致! 
33行的身份证号码重复
33行的身份证籍贯信息不一致! 
34行的身份证籍贯信息不一致! 
35行的身份证籍贯信息不一致! 
36行的身份证号码长度有误
36行的身份证籍贯信息不一致! 
37行的身份证籍贯信息不一致! 
38行的身份证籍贯信息不一致! 
39行的身份证籍贯信息不一致! 
40行的身份证籍贯信息不一致! 
41行的身份证籍贯信息不一致! 
42行的身份证籍贯信息不一致! 
43行的身份证籍贯信息不一致! 
44行的身份证籍贯信息不一致! 
45行的身份证籍贯信息不一致! 
46行的身份证籍贯信息不一致! 
47行的身份证籍贯信息不一致! 
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/640059.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言中的函数

概述 函数是一种可重用的代码块&#xff0c;用于执行特定任务或完成特定功能函数作用&#xff1a;对具备相同逻辑的代码进行封装&#xff0c;提高代码的编写效率&#xff0c;实现对代码的重用函数作用演示代码&#xff1a; #include <stdio.h>// 定义函数 void func() {…

线性表的顺序存储如何设计实现?

如何存储 顺序及链式实现 计算机中的状态

day83 AJAX

1什么是AJAX AJAX语法 AJAX Asynchronous JavaScript and XML 异步js和XML 实现页面某一部份更新&#xff0c;无需服务器转发或重定向 1 $.ajax() 语法: $.ajax( { "url" : "url&qu…

javaScript3

javaScript 一.对象1.概念2.创建对象的三种方法(1).字面量创建&#xff08;利用{}&#xff09;(2)变量、属性、函数、方法的区别(3).new Object创建(4).构造函数 3.new关键字的执行过程4.遍历对象&#xff08;for..in) 二.内置对象 一.对象 1.概念 一组无序的相关属性和方法的…

前端学习之DOM编程案例:点名案例和秒表案例

点名 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>点名案例</title><style>*{margin: 0;padding: 0;}</style> </head> <body><div id"container">…

声明式事务

文章目录 1.事务分类1.传统方式解决事务2.声明式事务 2.声明式事务案例1.需求分析2.解决方案分析3.数据表创建4.编写GoodsDao.java1.编写配置文件JdbcTemplate_ioc.xml2.单元测试 5.编写GoodsService.java6.配置事务管理器JdbcTemplate_ioc.xml7.进行测试 3.debug事务管理器Dat…

2. 链表

链表的概念及结构 概念&#xff1a;链表是⼀种物理存储结构上⾮连续、⾮顺序的存储结构&#xff0c;数据元素的逻辑顺序是通过链表中的指针链接次序实现的 。 链表的结构跟⽕⻋⻋厢相似&#xff0c;淡季时⻋次的⻋厢会相应减少&#xff0c;旺季时⻋次的⻋厢会额外增加⼏节。…

@NameBinding注解名称绑定过滤器/拦截器

NameBinding注解名称绑定过滤器/拦截器&#xff0c;只针对某一些资源方法执行处理逻辑 一、为什么要用名称绑定 一般情况下&#xff0c;借助Spring的过滤器或者拦截器等对Http请求或响应进行处理就能满足需求。但是在有些场景下若只需对特定的xxxResource做拦截处理&#xff0…

【ARM Trace32(劳特巴赫) 使用介绍 12.1 -- Trace32 读写 64位地址】

请阅读【Trace32 ARM 专栏导读】 文章目录 Trace32 读写 64位地址读 64 位地址写64位地址Trace32 读写 64位地址 在使用TRACE32进行调试时,有时需要读取或操作64位的地址,特别是在处理64位的处理器或操作系统时。以下是如何在TRACE32中读取64位地址的一般方法。 读 64 位地…

vue-element-admin vue设置动态路由 刷新页面后出现跳转404页面Bug 解决方法

做项目时遇到的这个bug&#xff0c;因为除了跳404之外也没太大影响&#xff0c;之前就一直放着没管&#xff0c;现在项目基本功能实现了&#xff0c;转头处理了一下&#xff0c;现在在这里记录一下解决方法 这个bug的具体情况是&#xff1a;设置了动态路由之后&#xff0c;不同…

FPGA - ZYNQ 基于Axi_Lite的PS和PL交互

前言 在FPGA - ZYNQ 基于EMIO的PS和PL交互中介绍了ZYNQ 中PS端和PL端交互的开发流程&#xff0c;接下来构建基于基于Axi_Lite的PS和PL交互。 开发流程 Axi_Lite从机 在FPGA - AXI4_Lite&#xff08;实现用户端与axi4_lite之间的交互逻辑&#xff09;中&#xff0c;详解介绍…

微信小程序:基于MySQL+Nodejs的汽车品牌管理系统

各位好&#xff0c;接上期&#xff0c;今天分享一个通过本地MySQLNodejs服务器实现CRUD功能的微信小程序&#xff0c;一起来看看吧~ 干货&#xff01;微信小程序通过NodeJs连接MySQL数据库https://jslhyh32.blog.csdn.net/article/details/137890154?spm1001.2014.3001.5502 …