java

关注公众号 jb51net

关闭
首页 > 软件编程 > java > Java解决PDF转图片体积过大

Java使用Apache PDFBox进行PDF转图片体积过大的优化指南

作者:一勺菠萝丶

在项目中,我们有一个接口用于将 PDF 按页拆分为图片,方便前端逐页展示,上线一段时间后发现体积过大了,下面我们就来看看如何进行简单的优化吧

一、背景

在项目中,我们有一个接口用于将 PDF 按页拆分为图片,方便前端逐页展示。

原始实现逻辑:

上线一段时间后发现:

于是开始排查问题。

二、问题分析

造成图片体积过大的核心原因有 3 个:

DPI 过高

原始代码:

renderer.renderImageWithDPI(i, 144);

144 DPI 会生成较高分辨率图片,页面尺寸较大。

DPI 越高,生成的图片分辨率越大,文件体积呈指数级增长。

不做尺寸限制

直接按 PDF 原始尺寸渲染输出。

例如:

对于仅用于网页展示来说完全没有必要。

使用 PNG 无损格式

PNG 是无损压缩,适合:

但对于:

PNG 文件体积会非常大。

总结一句话

高 DPI + 原始大尺寸 + PNG 无损 = 单页图片非常大

三、优化目标

在保证肉眼清晰可读的前提下:

并且:

四、整体优化方案

优化策略:

五、最终实现代码(核心优化版)

public class PdfToImageUtil {

    /**
     * 将 PDF 逐页转为压缩后的 PNG 图片
     */
    public static List<BizPptImage> convertPdfToImages(File pdfFile,
                                                       String outputDir,
                                                       String courseDetailId) throws IOException {

        List<BizPptImage> list = new ArrayList<>();

        try (PDDocument doc = PDDocument.load(pdfFile)) {

            PDFRenderer renderer = new PDFRenderer(doc);
            int pageCount = doc.getNumberOfPages();

            for (int i = 0; i < pageCount; i++) {

                // ① 降低 DPI(原 144 → 96)
                BufferedImage sourceImage = renderer.renderImageWithDPI(i, 96);

                // ② 限制最大宽度,等比例缩放
                BufferedImage scaledImage = scaleIfNecessary(sourceImage, 1280);

                String fileName = UUID.randomUUID() + "_" + (i + 1) + ".png";
                File outFile = new File(outputDir, fileName);

                ImageIO.write(scaledImage, "PNG", outFile);

                BizPptImage vo = new BizPptImage();
                vo.setImagePath(outFile.getAbsolutePath());
                vo.setFileName(fileName);
                vo.setCourseDetailId(courseDetailId);

                list.add(vo);
            }
        }

        return list;
    }

    /**
     * 按最大宽度等比例缩放
     */
    private static BufferedImage scaleIfNecessary(BufferedImage source, int maxWidth) {

        int width = source.getWidth();
        int height = source.getHeight();

        if (width <= maxWidth) {
            return source;
        }

        double scale = (double) maxWidth / width;
        int targetWidth = maxWidth;
        int targetHeight = (int) Math.round(height * scale);

        BufferedImage target = new BufferedImage(
                targetWidth,
                targetHeight,
                BufferedImage.TYPE_INT_RGB
        );

        Graphics2D g2d = target.createGraphics();
        g2d.setRenderingHint(RenderingHints.KEY_INTERPOLATION,
                RenderingHints.VALUE_INTERPOLATION_BILINEAR);
        g2d.setRenderingHint(RenderingHints.KEY_RENDERING,
                RenderingHints.VALUE_RENDER_QUALITY);
        g2d.setRenderingHint(RenderingHints.KEY_ANTIALIASING,
                RenderingHints.VALUE_ANTIALIAS_ON);

        g2d.drawImage(source, 0, 0, targetWidth, targetHeight, null);
        g2d.dispose();

        return target;
    }
}

六、参数调优建议

平衡清晰度 + 体积(推荐)

适合 PC 展示场景。

清晰度优先

适合高分屏场景。

体积优先(缩略图/预览)

图片体积可以大幅降低。

七、优化顺序建议

建议按以下步骤逐步调优:

八、如果体积仍然偏大

可以考虑:

改为 JPEG

JPEG 是有损压缩,体积会显著下降。

缺点:

如果对清晰度要求不极端,可以考虑此方案。

九、优化效果验证方式

同一份 PDF:

对比:

ls -lh
du -sh 目录名

重点观察:

十、最终效果

在本项目中:

原方案:

优化后:

结果:

并且:

十一、经验总结

PDF 转图片时,一定要考虑:

默认配置往往偏“高清优先”,不适合大规模线上使用。

一句话总结:PDF 转图片不优化,迟早磁盘爆炸。

到此这篇关于Java使用Apache PDFBox进行PDF转图片体积过大的优化指南的文章就介绍到这了,更多相关Java解决PDF转图片体积过大内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文