wkhtmltopdf 是一个开源的命令行工具,用于将 HTML 页面转换为 PDF 文档。它使用 Qt WebKit 渲染引擎,支持 CSS、JavaScript 等前端技术,并提供丰富的配置选项,使用户能够控制转换过程。
下载步骤
(1)打开官网链接:https://wkhtmltopdf.org/downloads.html
根据自己电脑系统和操作位进行下载
(2)下载时一定要注意自己的安装位置,方便后续配置环境变量,打开下载文件夹中的/bin。我这里是‘D:\wkhtmltopdf\bin’
(3)配置环境变量:此电脑>>属性>>高级系统设置>>环境变量>>系统变量中的:Path变量>>进入将‘D:\wkhtmltopdf\bin’添加到其中
(4)Win + R 在输入框中输入cmd(命令提示符)
C:\Users\Windows 10>wkhtmltopdf -V
提示wkhtmltopdf 0.12.6 (with patched qt)
代表环境变量配置成功
(5)通过pdfkit第三方python包,来实现
Win + R 在输入框中输入cmd(命令提示符)
输入pip install pdfkit
提示下载成功即可
(6)当下载成功后,需要知道wkhtmltopdf的路径
打开命令提示符输入 where wkhtmltopdf
显示:D:\wkhtmltopdf\bin\wkhtmltopdf.exe
(7)利用python实现html转化为pdf
点击查看代码
import pdfkit
# 本地HTML文件路径
local_html_file_path = '文件名.html'# PDF文件输出路径
pdf_file_path = '报告输出文件夹.pdf'# 指定wkhtmltopdf的路径
config = pdfkit.configuration(wkhtmltopdf='将(6)步骤得到的应用程序放到里面D:\wkhtmltopdf\bin\wkhtmltopdf.exe')# 使用配置好的pdfkit将HTML转换为PDF
pdfkit.from_file(local_html_file_path, pdf_file_path, configuration=config, options={'encoding': 'utf-8',"enable-local-file-access":True})
注意:如果html网页附带其他图片、css等信息,可以把这些文件附带下载与html网页放到一个文件夹中,wkhtmltopdf会自动读取这些信息,根据其文件信息来生成pdf文件。
如果想删除html文件本身不需要的内容,可以利用第三方工具打开html文件,删除相关内容后再生成pdf文件。