将多个PDF文档中的指定页,合并生成新的PDF

news/2025/3/19 13:35:45/文章来源:https://www.cnblogs.com/vipsoft/p/18780855

pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

代码如下:

from PyPDF2 import PdfReader, PdfWriter
# pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple# 定义要处理的PDF文件及其完整路径
pdf_files = {'数模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\数学一模每日一练5(3.18).pdf',  # 替换为A.pdf的实际路径'数招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招考试—数学每日一练5(3.18).pdf',  # 替换为B.pdf的实际路径'物模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\物理一模每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'物招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招考试—物理每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'化模.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\化学一模每日一练5(3.18).pdf',  # 替换为C.pdf的实际路径'化招.pdf': r'D:\Users\Documents\WeChat Files\FileStorage\File\2025-03\自招版—化学每日一练5(3.18).pdf'    # 替换为C.pdf的实际路径
}# 定义要提取的页码(注意:页码从0开始)
pages_to_extract = {'数模.pdf': [0],  # 提取A.pdf的第1页和第3页'数招.pdf': [0],  # 提取B.pdf的第2页'物模.pdf': [0],  # 提取C.pdf的第1页和第2页'物招.pdf': [0],  # 提取A.pdf的第1页和第3页'化模.pdf': [0],  # 提取B.pdf的第2页'化招.pdf': [0]  # 提取C.pdf的第1页和第2页
}# 创建一个PdfWriter对象来保存合并后的PDF
output_pdf = PdfWriter()# 遍历每个PDF文件
for pdf_name, pdf_path in pdf_files.items():# 读取PDF文件reader = PdfReader(pdf_path)# 获取要提取的页码pages = pages_to_extract.get(pdf_name, [])# 遍历要提取的页码for page_num in pages:# 获取指定页page = reader.pages[page_num]# 将页添加到输出PDF中output_pdf.add_page(page)# 将合并后的PDF写入到输出文件
output_path = r'D:\Users\Desktop\0319.pdf'  # 替换为输出文件的实际路径
with open(output_path, 'wb') as output_file:output_pdf.write(output_file)print(f"PDF合并完成,已保存为 {output_path}")

代码说明:

  • PdfReader:用于读取 PDF 文件。
  • PdfWriter:用于创建和写入新的 PDF 文件。
  • pages_to_extract:一个字典,指定每个 PDF 文件中要提取的页码。注意,页码从 0 开始。
  • output_pdf.add_page(page):将指定的页面添加到输出 PDF 中。
  • output_pdf.write(output_file):将合并后的 PDF 写入到输出文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/901497.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电视机顶盒刷机,更改固件包教程

这几天捣鼓了很久的刷机包,终于学会了怎么把已经弄好的刷机包,更改成自己想要的桌面。下面是我整理好的详细教程,本教程所需工具:刷机包大全、MLK软件、mumu模拟器 刷机包大全: 链接: https://pan.baidu.com/s/1G0on4sV9QmpxPXLUSN5ttQ?pwd=5279 提取码: 5279 一.确定机顶…

Java技术栈面试八股文:掌握这九大关键领域

Java基础:这是Java开发的基石,包括Java语言的基本语法、数据类型、控制结构、面向对象编程(OOP)概念(如类、对象、继承、封装、多态)、异常处理、集合框架等。掌握这些基础知识对于理解更高级的Java特性至关重要。Java Web基础:涉及Java在Web开发中的应用,包括Servlet、…

Unity —— SpriteAtlas + Include in Build

前言在使用atlas Sprite的过程中,会忍不住产生一个疑问,atlas是做什么用的,这个include in Build的含义是什么呢,以及它是否应该被勾选。网上查阅到了很多资源,有的说这个选项大胆勾选,有的说这个选项勾选完后图集打包后的纹理在游戏启动后,会一直常驻内存,需要自己做好…

2025预测:PLM系统集成AI的7种智能决策应用场景

随着科技的飞速发展,产品生命周期管理(PLM)系统与人工智能(AI)的集成正逐渐成为企业提升竞争力的关键因素。这种集成不仅能够优化产品开发流程,还能在多个环节实现智能决策,为企业带来前所未有的价值。在2025 年,我们有望看到 PLM 系统集成 AI 后在众多领域展现出强大的…

PLM项目管理软件在汽车行业的应用案例

PLM项目管理软件在汽车行业的应用案例 汽车行业作为制造业的重要组成部分,面临着日益复杂的产品研发、生产管理等挑战。在这样的背景下,PLM(产品生命周期管理)项目管理软件应运而生,为汽车企业提升竞争力提供了有力支持。PLM项目管理软件涵盖了从产品概念设计到产品退役的…

java自学学习路线笔记+实践项目+面试八股文

基础知识巩固Java基础:掌握基本语法、数据类型、控制结构、面向对象等核心概念。推荐学习资源:韩顺平老师的B站课程。 Java进阶:深入学习集合框架、IO流、反射、注解等高级特性。 Java并发:理解线程、锁、并发工具类等,为高并发项目开发打基础。数据库技术MySQL:掌握SQL语…

awdp pwn

ciscn&ccb半决第十八届CISCN&CCB半决赛 awdp pwn typo snprintf() 是一个 C 语言标准库函数,用于格式化输出字符串,并将结果写入到指定的缓冲区,与 sprintf() 不同的是,snprintf() 会限制输出的字符数,避免缓冲区溢出。 C 库函数 int snprintf(char str, size_t …

matlab并行计算

parfor比较难用,要求变量之间不能有干扰,必须能相互独立,这里推荐一下parfeval,相当于多开了n个matlab。 parfeval可以并行运行同一个函数,赋值不同的参数。 首先创建并行池-: p = parpool(2);%这里相当于使用了两个核心,根据你的CPU核心数决定。parfeval用于并行执行代…

1.4K star!几分钟搞定AI视频创作,这个开源神器让故事可视化如此简单!

story-flicks 是一个基于AI技术的自动化视频生成工具,能够将文字剧本快速转化为高质量短视频。开发者@alecm20通过深度学习算法,实现了从文本解析到视频合成的全流程自动化处理,支持多平台适配输出,是内容创作者和自媒体运营者的效率神器。 嗨,大家好,我是小华同学,关注…

C#实现自己的Json解析器(LALR(1)+miniDFA)

C#实现自己的Json解析器(LALR(1)+miniDFA) Json是一个用处广泛、文法简单的数据格式。本文介绍如何用bitParser(拥有自己的解析器(C#实现LALR(1)语法解析器和miniDFA词法分析器的生成器))迅速实现一个简单高效的Json解析器。 读者可在(JsonFormat)查看、下载完整代码。 J…

R语言中绘制火山图

001、# 生成随机数据 set.seed(123) # 设置种子以便结果可重复 genes <- paste("Gene", 1:1000) # 基因名称 logFC <- rnorm(1000, mean = 0, sd = 2) # log2 fold change,均值为0,标准差为2的正态分布 pvalue <- runif(1000, min = 0, max = 1) # p值…