使用 Python将pdf转化为图片

9,737次阅读

共计 1278 个字符，预计需要花费 4 分钟才能阅读完成。

使用 Python 将 pdf 转化为图片

环境准备

在开始之前，确保你的 Python 环境中安装了正确版本的 pymupdf 库。推荐使用 pymupdf==1.18.16 版本，因为其他版本可能会在调用 get_pixmap 属性时出现异常。你可以通过以下命令进行安装：

pip install pymupdf==1.18.16

转换流程

1. 导入库

首先，你需要导入 fitz 模块，这是 pymupdf 库的核心组件。

import fitz

2. 打开 PDF 文件

使用 fitz.open 函数打开你的 PDF 文件，并指定文件路径。

doc = fitz.open(pdf_path)

3. 选择页面

通过指定页面编号，你可以获取 PDF 中的特定页面。

page = doc[page_number]

4. 转换为图片

使用 get_pixmap 方法将 PDF 页面转换为图片。你可以通过调整 scale 参数来控制输出图片的清晰度。增加 scale 的值不仅可以提高图片质量，但也可能增加转换时间和文件大小。

# 定义清晰度比例
scale = 2.0  # 你可以根据需要调整这个值
# 转换页面为图片
pix = page.get_pixmap(alpha=True, matrix=fitz.Matrix(scale, scale))

5. 保存图片

将转换后的图片保存到指定路径。确保你的路径是正确的，并且你有足够的权限来写入文件。

pix.save(output_path)

6. 关闭文档

转换完成后，不要忘记关闭 PDF 文档以释放资源。

doc.close()

注意事项

安装版本 pymupdf==1.18.16

安装其他版本会异常找不到 get_pixmap 这个属性

完整代码示例

import fitz

# 打开 PDF 文件 pdf_path：pdf 文件路径
doc = fitz.open(pdf_path)

# 获取指定页面 page_number：根据下标获取页数，或使用循环
page = doc[page_number]

# 转换为图片，scale 参数可以调整清晰度
# 增加 scale 的值可以提高图片的清晰度，但同时可能会增加转换时间和生成的图片文件大小。pix = page.get_pixmap(alpha=True, matrix=fitz.Matrix(scale, scale))

# 保存图片 output_path：图片路径
pix.save(output_path)

# 关闭 PDF 文档
doc.close()

文章来源地址 https://www.toymoban.com/diary/python/751.html

到此这篇关于使用 Python 将 pdf 转化为图片的文章就介绍到这了, 更多相关内容可以在右上角搜索或继续浏览下面的相关文章，希望大家以后多多支持 TOY 模板网！

原文地址:https://www.toymoban.com/diary/python/751.html

如若转载，请注明出处：如若内容造成侵权 / 违法违规 / 事实不符，请联系站长进行投诉反馈，一经查实，立即删除！

正文完

Python

发表至：开发笔记

1970-01-01

0

转载说明：

1 本网站名称：优杰开发笔记
2 本站永久网址：https://yojack.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站所有内容均可转载及分享, 但请注明出处
6 我们始终尊重原创作者的版权，所有文章在发布时，均尽可能注明出处与作者。
7 站长邮箱：laylwenl@gmail.com

echarts：基本使用

探索W3C在线编程工具：简化开发、提升效率

解决Object of type ‘ndarray‘ is not JSON serializable

移动端Click300毫秒点击延迟解决办法

已是最早的文章