python实现PDF压缩

目前只针对纯PDF图片压缩。实现原理：主要通过PYMUPDF进行图片提取，图片压缩，再合并生成一个新的PDF。1.安装依赖包笔者的环境是Windows 10，Python3.8pip install fitz2.提取原PDF关键代码3.合并图片生成PDFimport globimport fitzimport osimport time# 1.提取原PDF关键代码def pdf2pic(file

紫芝

3146人浏览 · 2021-05-07 20:27:57

紫芝 · 2021-05-07 20:27:57 发布

目前只针对纯PDF图片压缩。
实现原理：主要通过PYMUPDF进行图片提取，图片压缩，再合并生成一个新的PDF。

1.安装依赖包

笔者的环境是Windows 10，Python3.8

pip install fitz

2.提取原PDF关键代码

3.合并图片生成PDF

import glob
import fitz
import os
import time

# 1.提取原PDF关键代码
def pdf2pic(filename):
    image_floder='pdf'+str(time.time())
    os.mkdir(image_floder)

    pdffile = filename
    doc = fitz.open(pdffile)
    width, height = fitz.PaperSize("a4")
    
    totaling = doc.pageCount
    
    for pg in range(totaling):
        page = doc[pg]
        zoom = int(100)
        rotate = int(0)
        print(page)
        trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate)
        pm = page.getPixmap(matrix=trans, alpha=False)
        lurl=image_floder+'/%s.jpg' % str(pg+1)
        pm.writePNG(lurl)
    doc.close()
    return image_floder
 
# 2.合并图片生成PDF
def pic2pdf(image_floder):
    doc = fitz.open()
    for img in sorted(glob.glob(image_floder+"/*")):  # 读取图片，确保按文件名排序
        print(img)
        imgdoc = fitz.open(img)                 # 打开图片
        pdfbytes = imgdoc.convertToPDF()        # 使用图片创建单页的 PDF
        imgpdf = fitz.open("pdf", pdfbytes)
        doc.insertPDF(imgpdf)                   # 将当前页插入文档
    if os.path.exists("newpdf.pdf"):        # 若文件存在先删除
        os.remove("newpdf.pdf")
    doc.save("newpdf.pdf")                   # 保存pdf文件
    doc.close()

image_floder=pdf2pic(filename='paper.pdf')
pic2pdf(image_floder)

4.遇到的问题

python ModuleNotFoundError: No module named ‘frontend‘

解决方法：

pip install PyMuPDF==1.16.14

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI大数据的后端架构设计如何确保高并发数据处理

确保AI大数据系统在高并发情况下的稳定运行，不仅依赖于优秀的架构设计，还需要深刻理解系统的瓶颈并进行针对性优化。在面对未来数据量和请求量日益增加的情况下，具备强大并发处理能力的后端架构将是AI大数据应用成功的关键。在面对突发流量时，系统需要能够进行动态扩展。随着人工智能和大数据技术的迅速发展，数据量的爆炸式增长以及实时数据处理的需求，迫使后端架构必须具备强大的高并发数据处理能力。尤其是在需要处理大

讯飞AI开发者社区

前端、后端与AI大数据：共建智慧医疗系统的关键

智慧医疗系统的构建是一个复杂而庞大的工程，涉及到前端、后端与AI大数据等多个领域的技术融合。然而，正是这些技术的创新与融合，推动了医疗行业向更加智能化、便捷化、个性化的方向发展。未来，随着人工智能、大数据技术的不断发展，医疗系统将变得更加高效、精准，也会为全球的患者提供更为优质的医疗服务。前端、后端和AI大数据的有机结合，必将成为智慧医疗系统成功的关键。

讯飞AI开发者社区

2025年智能楼宇市场现状、趋势与未来机会分析

智能楼宇作为智慧城市的重要组成部分，正经历从单点智能化向全场景智慧化的战略转型。随着物联网、人工智能、大数据等新兴技术的深度融合，以及“双碳”战略的持续推进，智能楼宇市场正迎来新一轮增长周期。本报告聚焦全球及中国智能楼宇市场，通过全面分析市场规模、结构、技术趋势、竞争格局等关键维度，为行业参与者提供决策参考。智能楼宇是指以建筑为平台，兼备建筑设备、办公自动化及通信网络系统，集结构、系统、服务、管理