关于Poi读取Excel引发内存溢出问题的解决方法
发布时间 - 2026-01-11 03:02:32 点击率:次前言

最近生产环境有个老项目一直内存报警,不时的还出现内存泄漏,导致需要重启服务器,已经严重影响正常服务了。
分析
1.dump内存文件
liunx使用如下命令:
./jmap -dump:format=b,file=heap.hprof pid
2.使用Eclipse Memory Analysis进行分析
异常如下:
at org.apache.poi.xssf.usermodel.XSSFRow.<init>(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTRow;Lorg/apache/poi/xssf/usermodel/XSSFSheet;)V (XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTWorksheet;)V (XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(Ljava/io/InputStream;)V (XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead()V (XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead()V (XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(Lorg/apache/poi/POIXMLFactory;)V (POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(Ljava/io/InputStream;)V (XSSFWorkbook.java:179)
POI在加载Excel引发了内存泄漏,中间创建了大量的对象,占用了大量的内存
3.查看上传的Excel大小
经查看发现很多Excel大小在9M的文件
4.查看代码POI读取Excel的方式
发现使用的是用户模式,这样会占用大量的内存;POI提供了2中读取Excel的模式,分别是:
- 用户模式:也就是poi下的usermodel有关包,它对用户友好,有统一的接口在ss包下,但是它是把整个文件读取到内存中的,
对于大量数据很容易内存溢出,所以只能用来处理相对较小量的数据; - 事件模式:在poi下的eventusermodel包下,相对来说实现比较复杂,但是它处理速度快,占用内存少,可以用来处理海量的Excel数据。
经上面分析基本可以确定问题出在使用POI的用户模式去读取Excel大文件,导致内存泄漏。
本地重现
下面模拟一个600kb大小的Excel(test.xlsx),分别用两种模式读取,然后观察内存波动;
1.需要引入的库maven:
<dependencies> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.6</version> </dependency> <dependency> <groupId>com.syncthemall</groupId> <artifactId>boilerpipe</artifactId> <version>1.2.1</version> </dependency> </dependencies>
2.用户模式代码如下:
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
public class UserModel {
public static void main(String[] args) throws InterruptedException {
try {
Thread.sleep(5000);
System.out.println("start read");
for (int i = 0; i < 100; i++) {
try {
Workbook wb = null;
File file = new File("D:/test.xlsx");
InputStream fis = new FileInputStream(file);
wb = new XSSFWorkbook(fis);
Sheet sheet = wb.getSheetAt(0);
for (Row row : sheet) {
for (Cell cell : row) {
System.out.println("row:" + row.getRowNum() + ",cell:" + cell.toString());
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
Thread.sleep(1000);
} catch (Exception e) {
e.printStackTrace();
}
}
}
3.事件模式代码如下:
import java.io.InputStream;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xssf.eventusermodel.XSSFReader;
import org.apache.poi.xssf.model.SharedStringsTable;
import org.apache.poi.xssf.usermodel.XSSFRichTextString;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;
public class EventModel {
public void processOneSheet(String filename) throws Exception {
OPCPackage pkg = OPCPackage.open(filename);
XSSFReader r = new XSSFReader(pkg);
SharedStringsTable sst = r.getSharedStringsTable();
XMLReader parser = fetchSheetParser(sst);
InputStream sheet2 = r.getSheet("rId1");
InputSource sheetSource = new InputSource(sheet2);
parser.parse(sheetSource);
sheet2.close();
}
public XMLReader fetchSheetParser(SharedStringsTable sst) throws SAXException {
XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser");
ContentHandler handler = new SheetHandler(sst);
parser.setContentHandler(handler);
return parser;
}
private static class SheetHandler extends DefaultHandler {
private SharedStringsTable sst;
private String lastContents;
private boolean nextIsString;
private SheetHandler(SharedStringsTable sst) {
this.sst = sst;
}
public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException {
if (name.equals("c")) {
System.out.print(attributes.getValue("r") + " - ");
String cellType = attributes.getValue("t");
if (cellType != null && cellType.equals("s")) {
nextIsString = true;
} else {
nextIsString = false;
}
}
lastContents = "";
}
public void endElement(String uri, String localName, String name) throws SAXException {
if (nextIsString) {
int idx = Integer.parseInt(lastContents);
lastContents = new XSSFRichTextString(sst.getEntryAt(idx)).toString();
nextIsString = false;
}
if (name.equals("v")) {
System.out.println(lastContents);
}
}
public void characters(char[] ch, int start, int length) throws SAXException {
lastContents += new String(ch, start, length);
}
}
public static void main(String[] args) throws Exception {
Thread.sleep(5000);
System.out.println("start read");
for (int i = 0; i < 100; i++) {
EventModel example = new EventModel();
example.processOneSheet("D:/test.xlsx");
Thread.sleep(1000);
}
}
}
具体代码来源:http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api
4.设置VM arguments:-Xms100m -Xmx100m
UserModel运行结果直接报OutOfMemoryError,如下所示:
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded at java.lang.String.substring(String.java:1877) at org.apache.poi.ss.util.CellReference.separateRefParts(CellReference.java:353) at org.apache.poi.ss.util.CellReference.<init>(CellReference.java:87) at org.apache.poi.xssf.usermodel.XSSFCell.<init>(XSSFCell.java:105) at org.apache.poi.xssf.usermodel.XSSFRow.<init>(XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead(XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead(XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:179) at zh.excelTest.UserModel.main(UserModel.java:23)
EventModel可以正常运行,使用Java VisualVM监控结果如下:
UserModel模式下读取600kbExcel文件直接内存溢出,看了600kbExcel文件映射到内存中还是占用了不少内存;EventModel模式下可以流畅的运行。
5.设置VM arguments:-Xms200m -Xmx200m
UserModel可以正常运行,使用Java VisualVM监控结果如下:
EventModel可以正常运行,使用Java VisualVM监控结果如下:
UserModel模式和EventModel模式都可以正常运行,但是很明显UserModel模式回收内存更加频繁,而且在cpu的占用上更高。
总结
通过简单的分析以及本地运行两种模式进行比较,可以看到UserModel模式下使用的简单的代码实现了读取,但是在读取大文件时CPU和内存都不理想;
而EventModel模式虽然代码写起来比较繁琐,但是在读取大文件时CPU和内存更加占优。
好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
# poi读取excel内存溢出
# poi
# 读取
# 内存溢出
# poi读取excel
# 完美解决java读取大文件内存溢出的问题
# Java常见内存溢出异常分析与解决
# 浅谈java内存管理与内存溢出异常
# Java内存溢出和内存泄露
# 解决Java导入excel大量数据出现内存溢出的问题
# 正常运行
# 两种
# 用了
# 大文件
# 模式下
# 的是
# 好了
# 但是在
# 看了
# 都不
# 有个
# 它是
# 很容易
# 更高
# 可以看到
# 所示
# 这篇文章
# 速度快
# 很明显
# 谢谢大家
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
零基础网站服务器架设实战:轻量应用与域名解析配置指南
Laravel如何处理CORS跨域问题_Laravel项目CORS配置与解决方案
Laravel怎么实现验证码(Captcha)功能
Laravel如何实现数据导出到PDF_Laravel使用snappy生成网页快照PDF【方案】
如何用虚拟主机快速搭建网站?详细步骤解析
Laravel如何连接多个数据库_Laravel多数据库连接配置与切换教程
北京网站制作公司哪家好一点,北京租房网站有哪些?
如何在万网主机上快速搭建网站?
Java解压缩zip - 解压缩多个文件或文件夹实例
Laravel事件监听器怎么写_Laravel Event和Listener使用教程
Laravel如何实现全文搜索功能?(Scout和Algolia示例)
Gemini怎么用新功能实时问答_Gemini实时问答使用【步骤】
香港服务器建站指南:外贸独立站搭建与跨境电商配置流程
如何用AI帮你把自己的生活经历写成一个有趣的故事?
Laravel如何使用Seeder填充数据_Laravel模型工厂Factory批量生成测试数据【方法】
Laravel如何发送邮件_Laravel Mailables构建与发送邮件的简明教程
Laravel如何与Vue.js集成_Laravel + Vue前后端分离项目搭建指南
Laravel怎么上传文件_Laravel图片上传及存储配置
Laravel如何设置定时任务(Cron Job)_Laravel调度器与任务计划配置
如何用手机制作网站和网页,手机移动端的网站能制作成中英双语的吗?
如何生成腾讯云建站专用兑换码?
Laravel如何编写单元测试和功能测试?(PHPUnit示例)
儿童网站界面设计图片,中国少年儿童教育网站-怎么去注册?
HTML5打空格有哪些误区_新手常犯的空格使用错误【技巧】
电商网站制作多少钱一个,电子商务公司的网站制作费用计入什么科目?
如何安全更换建站之星模板并保留数据?
ChatGPT 4.0官网入口地址 ChatGPT在线体验官网
Laravel如何处理JSON字段的查询和更新_Laravel JSON列操作与查询技巧
如何在腾讯云服务器快速搭建个人网站?
佛山企业网站制作公司有哪些,沟通100网上服务官网?
Laravel如何实现本地化和多语言支持?(i18n教程)
太平洋网站制作公司,网络用语太平洋是什么意思?
如何在阿里云香港服务器快速搭建网站?
北京的网站制作公司有哪些,哪个视频网站最好?
ChatGPT常用指令模板大全 新手快速上手的万能Prompt合集
如何快速搭建高效香港服务器网站?
网站制作软件免费下载安装,有哪些免费下载的软件网站?
JS经典正则表达式笔试题汇总
长沙做网站要多少钱,长沙国安网络怎么样?
如何快速上传建站程序避免常见错误?
如何快速打造个性化非模板自助建站?
网站建设整体流程解析,建站其实很容易!
如何注册花生壳免费域名并搭建个人网站?
利用vue写todolist单页应用
C语言设计一个闪闪的圣诞树
Laravel Admin后台管理框架推荐_Laravel快速开发后台工具
Linux系统运维自动化项目教程_Ansible批量管理实战
Laravel如何使用Collections进行数据处理?(实用方法示例)
JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)
百度浏览器如何管理插件 百度浏览器插件管理方法

