赵乾舟 发表于 2022-11-27 16:48:10

PDF转图片的代码

import datetime
import os

import fitz# fitz就是pip install PyMuPDF


def pyMuPDF_fitz(pdfPath, imagePath):
    startTime_pdf2img = datetime.datetime.now()# 开始时间

    print("imagePath=" + imagePath)
    pdfDoc = fitz.open(pdfPath)
    for pg in range(pdfDoc.pageCount):
      page = pdfDoc
      rotate = int(0)
      # 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。
      # 此处若是不做设置,默认图片大小为:792X612, dpi=96
      zoom_x = 2.33333333# (1.33333333-->1056x816)   (2-->1584x1224)
      zoom_y = 2.33333333
      mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
      pix = page.getPixmap(matrix=mat, alpha=False)

      if not os.path.exists(imagePath):# 判断存放图片的文件夹是否存在
            os.makedirs(imagePath)# 若图片文件夹不存在就创建

      pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)# 将图片写入指定的文件夹内

    endTime_pdf2img = datetime.datetime.now()# 结束时间
    print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)


if __name__ == "__main__":
    # 1、PDF地址
    pdfPath = r'C:\Users\admin\Desktop\车载mp3\新建文件夹\a.pdf'
    # 2、需要储存图片的目录
    imagePath = r'C:\Users\admin\Desktop\车载mp3\新建文件夹'
    pyMuPDF_fitz(pdfPath, imagePath)
这里有个坑,就是需要安装pymupdf库,但是不能安装最新版本,目前亲测可用的版本是切换到1.18.17才可以顺利完成代码

页: [1]
查看完整版本: PDF转图片的代码