pypdf 将 PDF两个页面拼接成一个页面进一步详解

pypdf 原库名Pypdf2(已弃用,文档 PyPDF2 RectangleObject类_w3cschool)

pypdf 官方文档 The Transformation Class — pypdf 3.17.4 documentation

pypdf 将两个PDF页面在x轴,y轴进行平移调整位置之后,直接用merge_page拼接在一起,或者PageObject.create_blank_page 先创建一个空白页面,再将两个页面添加到空白页面上,

参考的文章Alternative to add_transformation translate · Issue #1426 · py-pdf/pypdf · GitHub,

page1.merge_page(page2, expand=True) doesn't seem to work · Issue #1035 · py-pdf/pypdf · GitHub

prpdf github中的问题解决页面拼接, 问题页面 https://github.com/py-pdf/pypdf/issues?page=2&q=is%3Aissue+is%3Aopen

小日子的两个案例,拼接在右侧

Pythonで2ページのPDFを見開き1ページに結合する方法 - ガンマソフト

Cropping and Transforming PDFs — PyPDF2 documentation

其他的案例

Blank pages in output file using PyPDF2 in Python ... - Alteryx Community

https://www.coder.rs/d/247-pythongei-pdfde-zhi-ding-ye-tian-jia-tu-pian-dao-zhi-ding-wei-zhi

多种方式实现PDF合并、生成目录及大纲、添加水印 - 徐彪的网络日志

1. 拼接的两个PDF都是正常的,距离左侧和底部都是0拼接过程中真正起作用的是page.mediabox和page.cropbox
from pypdf import PdfWriter, PdfReader, PageObject, Transformation
from pypdf.generic import RectangleObject
def merge():file_path1 = r"1703906324193.pdf"file_path2 = r"1703906324193.pdf"reader = PdfReader(file_path1)page1 = reader.pages[0]print(page1.mediabox)print(page1.trimbox)print(page1.cropbox)print(page1.bleedbox)print(page1.artbox)# 0.0, 0.0, 120.16, 159.92 对应 left, bottom, right, top# page1.mediabox: RectangleObject([0.0, 0.0, 120.16, 159.92])reader2 = PdfReader(file_path2)page2 = reader2.pages[0]height = page1.cropbox.heightprint('height:', height)# x轴不动,沿y轴向上平移page1的高度,将page1在下方,page2在上方(tx,ty可为负值)op = Transformation().translate(tx=0, ty=height)page2.add_transformation(op)cb = page2.cropbox# page2向y轴正向平移后bottom和top 加上平移的高度page2.mediabox = RectangleObject((cb.left, cb.bottom + height, cb.right, cb.top + height))page2.cropbox = RectangleObject((cb.left, cb.bottom + height, cb.right, cb.top + height))# page2.trimbox = RectangleObject((cb.left, cb.bottom + height, cb.right, cb.top + height))# page2.bleedbox = RectangleObject((cb.left, cb.bottom + height, cb.right, cb.top + height))# page2.artbox = RectangleObject((cb.left, cb.bottom + height, cb.right, cb.top + height))print('page2.mediabox:', page2.mediabox)# page1合并page2page1.merge_page(page2, expand=True)mb = page1.mediaboxprint('mb:', mb)print(mb.bottom)print(cb.bottom)# page1 在bottom 或者 top上 加 page2的高度,page1.mediabox = RectangleObject((mb.left, mb.bottom + cb.top, mb.right, mb.top))page1.cropbox = RectangleObject((mb.left, mb.bottom + cb.top, mb.right, mb.top))# page1.cropbox = RectangleObject((mb.left, mb.bottom, mb.right, mb.top + cb.top))# page1.trimbox = RectangleObject((mb.left, mb.bottom + cb.bottom, mb.right, mb.top))# page1.bleedbox = RectangleObject((mb.left, mb.bottom + cb.bottom, mb.right, mb.top))# page1.artbox = RectangleObject((mb.left, mb.bottom + cb.bottom, mb.right, mb.top))print('page1.mediabox:', page1.mediabox)writer = PdfWriter()writer.add_page(page1)with open("output96.pdf", "wb") as fp:writer.write(fp)
2. 当 left和buttom都不为0,即RectangleObject([91.841, 38.5506, 261.791, 95.1271])
用上面方法拼接出来的效果def merge():file_path1 = "1.pdf"file_path2 = "2.pdf"outfile = './output96.pdf'reader3 = PdfReader(file_path1)# 对p1的每页都拼接 p2, p1在上方, p2在下方writers = PdfWriter()for i in range(len(reader3.pages)):p1 = reader3.pages[i] #p1.cropbox RectangleObject([91.841, 38.5506, 261.791, 95.1271])reader = PdfReader(file_path2)p2 = reader.pages[0] #p2.cropbox= RectangleObject([91.841, 38.5506, 261.791, 95.1271])p1_left = p1.cropbox.leftp1_bottom = p1.cropbox.bottomp3_right = p1.cropbox.righttem = p2.cropbox.top - p2.cropbox.bottom# p1 向左和向上平移op1 = Transformation().translate(tx=-p1.cropbox.left, ty=(p2.cropbox.top - p2.cropbox.bottom)-p1_bottom)p1.add_transformation(op1)# p2 向左和向下, tx为正数向右平移op2 = Transformation().translate(tx=-p2.cropbox.left, ty=-p2.cropbox.bottom)p2.add_transformation(op2)p2.cropbox = RectangleObject((0, 0, p2.cropbox.right, p2.cropbox.top))p2.trimbox = RectangleObject((0, 0, p2.mediabox.right, p2.mediabox.top))p2.bleedbox = RectangleObject((0, 0, p2.mediabox.right, p2.mediabox.top))p2.artbox = RectangleObject((0, 0, p2.mediabox.right, p2.mediabox.top))p1.merge_page(p2, expand=True)mb = p1.mediaboxcb = p2.cropboxp1.mediabox = RectangleObject((mb.left, mb.bottom + cb.bottom, p3_right, p1.cropbox.top + tem))p1.cropbox = RectangleObject((mb.left, mb.bottom + cb.bottom, p3_right-p1_left, p1.cropbox.top + tem-p1_bottom))p1.trimbox = RectangleObject((mb.left, mb.bottom + cb.bottom, p3_right, p1.cropbox.top))p1.bleedbox = RectangleObject((mb.left, mb.bottom + cb.bottom, p3_right, p1.cropbox.top))p1.artbox = RectangleObject((mb.left, mb.bottom + cb.bottom, p3_right, p1.cropbox.top))writers.add_page(p1)with open(outfile, mode='wb') as f:writers.write(f)

1. left 和buttom 都为0时用方法1拼接发效果

2. 当 left和buttom都不为0,即RectangleObject([91.841, 38.5506, 261.791, 95.1271])
用上面方法拼接出来的效果, 

方法2调整之后的效果 和left 和buttom 都为0时用方法1拼接发效果一样

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/323905.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python学习曲线绘制

1. 学习曲线的绘制 learning_curve的使用案例 learning_curve 函数是 Scikit-learn 库中用于生成学习曲线的工具。以下是该函数的主要参数及其解释: estimator: 模型估计器(estimator),即要评估性能的机器学习模型。这是必需的参…

KubeSphere 社区双周报 | 2023.12.21-2024.01.04

KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为:2023.12.21-2024.…

AOP(面向切面编程)基于注解方式配置

不会注解的小伙伴看这里哦&#xff1a;Spring常用注解&#xff01;&#xff01;&#xff01;-CSDN博客 pom.xml <dependencies><dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><version&g…

Python从入门到网络爬虫(内置函数详解)

前言 Python 内置了许多的函数和类型&#xff0c;比如print()&#xff0c;input()等&#xff0c;我们可以直接在程序中使用它们&#xff0c;非常方便&#xff0c;并且它们是Python解释器的底层实现的&#xff0c;所以效率是比一般的自定义函数更有效率。目前共有71个内置函数&…

苹果Mac图像修图软件Photomator和Pixelmator Pro 有什么区别?

同为一个团队设计的Mac修图软件Photomator和Pixelmator Pro有哪些区别呢&#xff1f;有哪些不一样的功能&#xff1f; Photomator和Pixelmator Pro区别如下&#xff1a; 1、用途不同 Photomator 和 Pixelmator Pro 是两个功能强大的应用程序&#xff0c;具有两个不同的用途。…

Mysql 将表里的两列值数据互换

示例&#xff1a; 需要将表中的 两个订单号互换 方案&#xff1a; 将同一张表数据做 临时数据 和主表 做数据交互 。 update 表 as main, 表 as temp set main.bill_no temp.track_bill_no, main.track_bill_no temp.bill_no where main.id temp.id…

小程序购物商城搭建开发分析

小程序商城作为现代商业模式的重要组成部分&#xff0c;具有巨大的发展潜力和商业价值。通过搭建一个功能完善、用户友好的小程序商城&#xff0c;您将能够提供便捷的购物体验&#xff0c;吸引更多的用户并实现商业增长。在进行小程序商城开发搭建之前&#xff0c;我们需要对项…

利用C#实现贪吃蛇

说明 本文根据B站up主唐老狮的课程所学所记 目录 说明本文根据B站up主唐老狮的课程所学所记 UML面向对象七大原则总体实现目标单一职责原则&#xff08;SRP&#xff0c;Single Responsibility Principle&#xff09;开闭原则&#xff08;OCP&#xff0c;Open-Closed Principle…

RT-Thread学习

RT-Thread是以Apache License v2开源许可发布的物联网操作系统。 RT-Thread有十多年的历史&#xff0c;在开发过程中也放在Github上由大家协同开发&#xff0c;并发布一个个版本&#xff0c;导致不同人群面对多样的版本无从下手。 RT-Thread的版本/分支有以下几种可供选择&…

陀螺研究院发布《中国产业区块链生态图谱 2024版》

从发展实践来看&#xff0c;产业区块链在我国已历经了4年的高速发展&#xff0c;发展至今&#xff0c;我国区块链发展环境基本夯实&#xff0c;形成了技术突破与应用拓宽的创新土壤&#xff0c;围绕区块链为主体的产业链条不断纵深延伸&#xff0c;在基础设施支撑、融合创新拓展…

烟花燃放如何管控?智能分析网关V4烟火检测保障烟火安全

一、方案背景 随着元旦佳节的热潮退去&#xff0c;春节也即将来临&#xff0c;在众多传统的中国节日里&#xff0c;烟花与烧纸祭祀都是必不可少的&#xff0c;一方面表达了人们对节日的庆祝的期许&#xff0c;另一方面也是一种对故者思念的寄托。烟花爆竹的燃放不仅存在着巨大的…

Java异常和异常处理(主要是try-catch的掌握)

异常 1、异常介绍 &#xff08;1&#xff09;基本概念 Java语言中&#xff0c;将程序执行中发生的不正常情况称为“异常”.(开发过程中的语法错误和逻辑错误不是异常) 快捷键&#xff1a; ctrlaltt&#xff0c;选中try-catch 执行过程中的异常可以分为两大类&#xff1a; …