首页 > 脚本专栏 > python > Python向指定PDF指定位置插入图片

基于Python实现向指定PDF指定页面指定位置插入图片的方法

2025-09-02 08:44:14 作者：Ratten

这篇文章主要介绍了使用Python批量为PDF添加虚拟章的方法,通过ReportLab创建覆盖层并结合PyPDF2实现精准合并,确保不破坏原有分辨率和文字可识别性,同时支持位置自定义与参数调整,需要的朋友可以参考下

1. 需求

想要能否实现批量自动为多个pdf加盖不同六格虚拟章（不改变pdf原有分辨率和文字可识别性）；
改在pdf首页上方空白位置，一般居中即可；
如可由使用者自主选择靠页边距更好，以便部分首页上方有字的文件时人工可微调位置。

2. 需求分析

直接将 pdf 文件转换为图片，在将图片绘制到对应页的对应位置，最后将全部图片在转换为 pdf 文件；
使用 reportlab 创建一个 pdf 页，然后将图片插入到对应位置；
使用 PyPDF2 将 reportlab 创建的含有图片 pdf 和目标页面进行合并。

3. 实现效果

4. 方案选择

由于要求不改变pdf原有分辨率和文字可识别性，因此就不能将 pdf 转图片，因为进行此步操作后，重新生成的 pdf 不能进行文字可识别性；
所以采用方案二 reportlab 配合 PyPDF2 完成需求的实现。

5. 设置插入图片宽高

init 默认插入图片的宽高；
reset_image_width_and_height 方法提供修改插入图片宽高的方法。

  def __init__(self):
    self.image_width = int(237 * 0.6)
    self.image_height = int(60 * 0.8)

  # 设置图片的宽高
  def reset_image_width_and_height(self, w, h):
    self.image_width = w
    self.image_height = h

6. 创建 pdf 插入图片

创建一个 BytesIO 对象；
Canvas 类是 ReportLab PDF 创建工具包的核心，它提供了一个画布，你可以在上面绘制文本、图形、图像等，以生成 PDF 文档；
创建一个 Canvas 对象，指定 packet 和页面大小；
drawImage 方法插入图像；
调用 save() 方法将绘制的内容保存到 packet 对象中；
packet.seek(0) 将文件指针移动到 BytesIO 对象的开头；
使用 PdfReader 读取 pdf 文件，并将第一页返回。

  # 创建一个PDF页面，并在其中放置图片
  def create_overlay(self, image_path, x_pos, y_pos, page_width, page_height):
    packet = io.BytesIO()
    can = canvas.Canvas(packet, pagesize=(page_width, page_height))
    can.drawImage(image_path, x_pos, y_pos, width=self.image_width, height=self.image_height)  # 图片位置和大小
    can.save()
    packet.seek(0)
    overlay = PdfReader(packet)
    return overlay.pages[0]

7. 合并插入图片的 pdf 页到目标 pdf

读取原始PDF文件【需要插入图片的 pdf】；
创建一个PDF writer对象；
遍历PDF的每一页，找到目标页面；
获取当前页面对象；
判断当前页是否是目标页面；
计算图片的插入位置；
调用 create_overlay 创建一个插入图片的 pdf 页面对象；
将 create_overlay 返回的页面通过 merge_page 合并到当前 page；
将每一个循环的 page 通过 add_page 添加到第二步中创建的 writer 对象中；
判断输出路径是否存在，然后写入 pdf。

  # 将创建的覆盖层合并到目标PDF的指定页面
  def merge_image_to_pdf(self, input_pdf_path, output_pdf_path, image_path, page_number, x_pos, y_pos):
    # 读取原始PDF文件
    original_pdf = PdfReader(open(input_pdf_path, "rb"))
    # 创建一个PDF writer对象
    pdf_writer = PdfWriter()
    # 遍历PDF的每一页
    for page_num in range(len(original_pdf.pages)):
      page = original_pdf.pages[page_num]
      if page_number == page_num:
        # 计算距离
        left_distance = int((page.mediabox.width - self.image_width) / 2 + x_pos)
        top_distance = int((page.mediabox.height - self.image_height) - y_pos)

        overlay = self.create_overlay(image_path, left_distance, top_distance, page.mediabox.width, page.mediabox.height)
        page.merge_page(overlay)
      pdf_writer.add_page(page)

    # 写入修改后的PDF
    with open(output_pdf_path, "wb") as out_file:
      pdf_writer.write(out_file)

8. 调用

初始化 InsertImageToPDF；
调用插入图片的方法 merge_image_to_pdf；
将图片【"./out_images/pdf.png"】插入pdf 【"./pdf/pdf-1/pdf-1.pdf"】，输出路径【"./out_images/pdf.png"】；
【0, 0, 10】插入第几页，图片距离左侧边距，图片距离顶部边距。

if __name__ == "__main__":
  pdf = InsertImageToPDF()
  # 使用函数
  pdf.merge_image_to_pdf(
    "./pdf/pdf-1/pdf-1.pdf", 
    "./out_pdf/pdf-1.pdf", 
    "./out_images/pdf.png", 
    0, 0, 10)

9. 运行结果

10. 完整代码

引入所需使用的库 reportlab， PyPDF2， io；
初始化插入图片的宽高，设置图片的宽高的函数；
创建一个PDF页面，并在其中放置图片；
将创建的覆盖层合并到目标PDF的指定页面。

from reportlab.pdfgen import canvas
from PyPDF2 import PdfWriter, PdfReader
import io

class InsertImageToPDF:
  def __init__(self):
    self.image_width = int(237 * 0.6)
    self.image_height = int(60 * 0.8)

  # 设置图片的宽高
  def reset_image_width_and_height(self, w, h):
    self.image_width = w
    self.image_height = h

  # 创建一个PDF页面，并在其中放置图片
  def create_overlay(self, image_path, x_pos, y_pos, page_width, page_height):
    packet = io.BytesIO()
    can = canvas.Canvas(packet, pagesize=(page_width, page_height))
    can.drawImage(image_path, x_pos, y_pos, width=self.image_width, height=self.image_height)  # 图片位置和大小
    can.save()
    packet.seek(0)
    overlay = PdfReader(packet)
    return overlay.pages[0]

  # 将创建的覆盖层合并到目标PDF的指定页面
  def merge_image_to_pdf(self, input_pdf_path, output_pdf_path, image_path, page_number, x_pos, y_pos):
    # 读取原始PDF文件
    original_pdf = PdfReader(open(input_pdf_path, "rb"))
    # 创建一个PDF writer对象
    pdf_writer = PdfWriter()
    # 遍历PDF的每一页
    for page_num in range(len(original_pdf.pages)):
      page = original_pdf.pages[page_num]
      if page_number == page_num:
        # 计算距离
        left_distance = int((page.mediabox.width - self.image_width) / 2 + x_pos)
        top_distance = int((page.mediabox.height - self.image_height) - y_pos)

        overlay = self.create_overlay(image_path, left_distance, top_distance, page.mediabox.width, page.mediabox.height)
        page.merge_page(overlay)
      pdf_writer.add_page(page)

    # 写入修改后的PDF
    with open(output_pdf_path, "wb") as out_file:
      pdf_writer.write(out_file)

if __name__ == "__main__":
  pdf = InsertImageToPDF()
  # 使用函数
  pdf.merge_image_to_pdf(
    "./pdf/pdf-1/pdf-1.pdf", 
    "./out_pdf/pdf-1.pdf", 
    "./out_images/pdf.png", 
    0, 0, 10)

11. 总结

实现同一个需求的方法和技术很多，我们需要选择最接近需求的方案；
技术尽量选择自己熟悉的，或者曾经实现或者学习过的技术，能够更快开发；
尽量多的接触更多的技术，直到每种技术之间的优劣势。

以上就是基于Python实现向指定PDF指定页面指定位置插入图片的方法的详细内容，更多关于Python向指定PDF指定位置插入图片的资料请关注脚本之家其它相关文章！