将多个PDF文档中的指定页，合并生成新的PDF-编程知识

将多个PDF文档中的指定页，合并生成新的PDF

news/2025/3/19 13:35:45/文章来源:https://www.cnblogs.com/vipsoft/p/18780855

pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

代码如下：

from PyPDF2 import PdfReader, PdfWriter
# pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple# 定义要处理的PDF文件及其完整路径
pdf_files = {'数模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\数学一模每日一练5(3.18).pdf',  # 替换为A.pdf的实际路径'数招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招考试—数学每日一练5(3.18).pdf',  # 替换为B.pdf的实际路径'物模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\物理一模每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'物招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招考试—物理每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'化模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\化学一模每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'化招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招版—化学每日一练5(3.18）.pdf'    # 替换为C.pdf的实际路径
}# 定义要提取的页码（注意：页码从0开始）
pages_to_extract = {'数模.pdf': [0],  # 提取A.pdf的第1页和第3页'数招.pdf': [0],  # 提取B.pdf的第2页'物模.pdf': [0],  # 提取C.pdf的第1页和第2页'物招.pdf': [0],  # 提取A.pdf的第1页和第3页'化模.pdf': [0],  # 提取B.pdf的第2页'化招.pdf': [0]  # 提取C.pdf的第1页和第2页
}# 创建一个PdfWriter对象来保存合并后的PDF
output_pdf = PdfWriter()# 遍历每个PDF文件
for pdf_name, pdf_path in pdf_files.items():# 读取PDF文件reader = PdfReader(pdf_path)# 获取要提取的页码pages = pages_to_extract.get(pdf_name, [])# 遍历要提取的页码for page_num in pages:# 获取指定页page = reader.pages[page_num]# 将页添加到输出PDF中output_pdf.add_page(page)# 将合并后的PDF写入到输出文件
output_path = r'D:\Users\Desktop\0319.pdf'  # 替换为输出文件的实际路径
with open(output_path, 'wb') as output_file:output_pdf.write(output_file)print(f"PDF合并完成，已保存为 {output_path}")

代码说明：

PdfReader：用于读取 PDF 文件。
PdfWriter：用于创建和写入新的 PDF 文件。
pages_to_extract：一个字典，指定每个 PDF 文件中要提取的页码。注意，页码从 0 开始。
output_pdf.add_page(page)：将指定的页面添加到输出 PDF 中。
output_pdf.write(output_file)：将合并后的 PDF 写入到输出文件。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/901497.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

C# .net 8 开发微信支付，Windows Server IIS 提示系统找不到指定的文件解决方案。

电视机顶盒刷机，更改固件包教程

这几天捣鼓了很久的刷机包，终于学会了怎么把已经弄好的刷机包，更改成自己想要的桌面。下面是我整理好的详细教程，本教程所需工具：刷机包大全、MLK软件、mumu模拟器刷机包大全：链接: https://pan.baidu.com/s/1G0on4sV9QmpxPXLUSN5ttQ?pwd=5279 提取码: 5279 一.确定机顶…

Java技术栈面试八股文：掌握这九大关键领域

Java基础：这是Java开发的基石，包括Java语言的基本语法、数据类型、控制结构、面向对象编程（OOP）概念（如类、对象、继承、封装、多态）、异常处理、集合框架等。掌握这些基础知识对于理解更高级的Java特性至关重要。Java Web基础：涉及Java在Web开发中的应用，包括Servlet、…

Unity —— SpriteAtlas + Include in Build

前言在使用atlas Sprite的过程中，会忍不住产生一个疑问，atlas是做什么用的，这个include in Build的含义是什么呢，以及它是否应该被勾选。网上查阅到了很多资源，有的说这个选项大胆勾选，有的说这个选项勾选完后图集打包后的纹理在游戏启动后，会一直常驻内存，需要自己做好…

2025预测：PLM系统集成AI的7种智能决策应用场景

随着科技的飞速发展，产品生命周期管理（PLM）系统与人工智能（AI）的集成正逐渐成为企业提升竞争力的关键因素。这种集成不仅能够优化产品开发流程，还能在多个环节实现智能决策，为企业带来前所未有的价值。在2025 年，我们有望看到 PLM 系统集成 AI 后在众多领域展现出强大的…

PLM项目管理软件在汽车行业的应用案例

PLM项目管理软件在汽车行业的应用案例汽车行业作为制造业的重要组成部分，面临着日益复杂的产品研发、生产管理等挑战。在这样的背景下，PLM（产品生命周期管理）项目管理软件应运而生，为汽车企业提升竞争力提供了有力支持。PLM项目管理软件涵盖了从产品概念设计到产品退役的…

java自学学习路线笔记+实践项目+面试八股文

基础知识巩固Java基础：掌握基本语法、数据类型、控制结构、面向对象等核心概念。推荐学习资源：韩顺平老师的B站课程。 Java进阶：深入学习集合框架、IO流、反射、注解等高级特性。 Java并发：理解线程、锁、并发工具类等，为高并发项目开发打基础。数据库技术MySQL：掌握SQL语…

awdp pwn

ciscn&ccb半决第十八届CISCN&CCB半决赛 awdp pwn typo snprintf() 是一个 C 语言标准库函数，用于格式化输出字符串，并将结果写入到指定的缓冲区，与 sprintf() 不同的是，snprintf() 会限制输出的字符数，避免缓冲区溢出。 C 库函数 int snprintf(char str, size_t …

matlab并行计算

parfor比较难用，要求变量之间不能有干扰，必须能相互独立，这里推荐一下parfeval，相当于多开了n个matlab。 parfeval可以并行运行同一个函数，赋值不同的参数。首先创建并行池-： p = parpool(2);%这里相当于使用了两个核心，根据你的CPU核心数决定。parfeval用于并行执行代…

1.4K star！几分钟搞定AI视频创作，这个开源神器让故事可视化如此简单！

story-flicks 是一个基于AI技术的自动化视频生成工具，能够将文字剧本快速转化为高质量短视频。开发者@alecm20通过深度学习算法，实现了从文本解析到视频合成的全流程自动化处理，支持多平台适配输出，是内容创作者和自媒体运营者的效率神器。嗨，大家好，我是小华同学，关注…

C#实现自己的Json解析器(LALR(1)+miniDFA)

C#实现自己的Json解析器(LALR(1)+miniDFA) Json是一个用处广泛、文法简单的数据格式。本文介绍如何用bitParser（拥有自己的解析器（C#实现LALR(1)语法解析器和miniDFA词法分析器的生成器））迅速实现一个简单高效的Json解析器。读者可在（JsonFormat）查看、下载完整代码。 J…

R语言中绘制火山图

001、# 生成随机数据 set.seed(123) # 设置种子以便结果可重复 genes <- paste("Gene", 1:1000) # 基因名称 logFC <- rnorm(1000, mean = 0, sd = 2) # log2 fold change，均值为0，标准差为2的正态分布 pvalue <- runif(1000, min = 0, max = 1) # p值…

将多个PDF文档中的指定页，合并生成新的PDF

相关文章