《Python趣味工具》——ppt的操作(2)

在上次,我们对PPT进行了简单的处理;本次,我们要将PPT中的文本内容写入到 Word 文档中并添加标题,让 Word 文档看上去结构清晰,方便使用。


在这里插入图片描述


文章目录

  • 一、安装docx模块:
  • 二、从PPT中转移文字:
    • 1. 创建空白文档:
    • 2. 将文本内容全部添加进 Word 文档中:
    • 3. 批量写入:
    • 4. 继续润色:
  • 三、完整源码:

一、安装docx模块:

要使用 Python 对 Word 文档进行操作,我们需要安装一个用于数据写入的工具 python-docx

需要注意的是,python-docx 模块只可读取、写入 .docx 文件,不支持 .doc 文件。

.docx .doc 都是 Word 的文件后缀名,其中:

  • .docx 是 Microsoft Office2007 之后的版本;
  • .doc 是 Microsoft Office2003 以前的版本。

安装python-docx非常简单,在终端中输入代码:
pip install python-docx

如果电脑中同时存在Python 2 和 3,可能需要将pip改成pip3。
pip3 install python-docx

如果在自己电脑上安装不上或安装缓慢,可在命令后添加如下配置进行加速:
pip install python-docx -i https://pypi.tuna.tsinghua.edu.cn/simple/


二、从PPT中转移文字:

安装完 python-docx 模块后,下一步就是导入这个模块。

需要注意的是,导入python-docx模块需要使用 import docx,而不是import python-docx。
我们想要把 .pptx 文件中的文本内容全部写入 Word 文档中:

1️⃣首先,就需要新建一个空白 Word 文档;
2️⃣其次,将文本内容全部添加进 Word 文档中;
3️⃣最后,保存这个文档。


1. 创建空白文档:

使用这段代码就可以在指定路径下新建一个空白 Word 文档。

import docx
docxFile = docx.Document()
docxFile.save("/Users/ziliao.docx")

docx.Document() 函数可以新建一个 Word 文档,返回一个空白的 Word 文档对象。

docx 模块中的 Document 类,若指定路径则是打开文档;若没有指定路径则是新建文档。

将返回的 Word 文档对象赋值给一个变量。

新建的 Word 文档需要使用 save() 函数,将文件路径作为参数传入,即可保存文件。


2. 将文本内容全部添加进 Word 文档中:

add_paragraph() 函数可以将一段文本添加到 Word 文档中。

将要写入的文本以字符串形式传入 add_paragraph() 函数中,就可以在 Word 文档中添加一个段落。

import docxdocxFile = docx.Document()docxFile.add_paragraph("你好,我是ziliao")docxFile.save("/Users/ziliao/趣味工具.docx")

3. 批量写入:

之前,我们已经将 PPT 中的文本内容以样式块为单元读取了出来。现在要将这些文本内容批量写入 Word 文档中,只需要在读取文本代码的后面,调用 add_paragraph() 函数,传入样式块的文本内容。

texts = run.text
# TODO 向docxFile中添加段落texts的文本内容
docxFile.add_paragraph(texts)

代码运行成功后,打开“资料.docx”这个文档,就可以看到写入的文本内容,真不错~

但是,文本内容全部排列在一起,中间没有换行,也没有提示哪些段落是哪一页的内容,查找起来很不方便,这该怎么办呢?🤔


4. 继续润色:

在这里,我们可以添加标题,让内容有层级,方便查看。

使用 add_heading() 函数,添加相关参数,就可以在文档中添加标题。

import docxdocxFile = docx.Document()docxFile.add_heading("我是标题",level=1)docxFile.save("/Users/Python.docx")

将字符串传入 add_heading() 函数中,设置标题的内容。
参数 level 是标题样式,设置为 1 表示一级标题,2表示二级标题,以此类推。

我们可以将 PPT 的页码,作为标题添加到 Word 文档中。

  • 首先,把变量 n 设置为 1;
  • 接着,程序在读取幻灯片页时,将本页的页码以二级标题的样式添加到 Word 文档中;
  • 然后,在本页内容写入完后,将变量 n 进行累加。
n=1
# for循环遍历pptxFile中的.slides属性,赋值给slide
for slide in pptxFile.slides:# TODO 向文档中添加标题",为二级标题docxFile.add_heading(f"第{n}页")# for循环遍历slide中.shapes属性,赋值给变量shapefor shape in slide.shapes:# 判断形状中是否有文本框if shape.has_text_frame == True:# 读取形状中的文本框,并赋值给变量textFrametextFrame = shape.text_frame# for循环遍历文本框内的所有段落# 赋值给变量paragraphfor paragraph in textFrame.paragraphs:# for循环遍历段落中的所有样式块# 赋值给变量runfor run in paragraph.runs:# 读取样式块中的文本内容texts = run.text# 向Word文档中添加段落texts的文本内容docxFile.add_paragraph(texts)# TODO 将变量n进行累加n+=1

代码运行成功后,打开“资料.docx”,在文档中生成了页码为内容的标题;在每个标题下,有该页对应的文本内容。


三、完整源码:

我们成功将 .pptx 文件中的文本内容写入到 Word 文档中,真棒呀👍👍👍

# 使用from...import从pptx模块中导入Presentation
from pptx import Presentation
# 使用import导入docx
import docx# 新建一个空白Word文档,赋值给变量docxFile
docxFile = docx.Document()# 将.pptx文件路径赋值给变量path
path = "/Users/xiaohe/statistics.pptx"
# 读取path并赋值给变量pptxFile
pptxFile = Presentation(path)# 将变量n设置为1
n = 1# for循环遍历pptxFile中的.slides属性,赋值给slide
for slide in pptxFile.slides:# 向文档中添加标题f"第{n}页",为二级标题docxFile.add_heading(f"第{n}页",level=2)# for循环遍历slide中.shapes属性,赋值给变量shapefor shape in slide.shapes:# 判断形状中是否有文本框if shape.has_text_frame == True:# 读取形状中的文本框,并赋值给变量textFrametextFrame = shape.text_frame# for循环遍历文本框内的所有段落# 赋值给变量paragraphfor paragraph in textFrame.paragraphs:# for循环遍历段落中的所有样式块# 赋值给变量runfor run in paragraph.runs:# 读取样式块中的文本内容texts = run.text# 向Word文档中添加段落texts的文本内容docxFile.add_paragraph(texts)# 将变量n进行累加n = n + 1# 保存文档到指定路径,并命名为"资料.docx"
docxFile.save("/Users/xiaohe/资料.docx")

你在本地练习读取自己的 PPT 写入 Word 文档时,可以先整理 PPT 中段落里样式块,尽量让一个段落的样式统一。

如果段落中的样式块过多,就会以一个样式块为一个段落写入 Word 文档中,再去调整文本格式就会很麻烦咯╮( ̄▽ ̄)╭


好了,今天的讲解就到这里,祝各位朋友们中秋节快乐!!!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/120684.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring结合自定义注解实现 AOP 切面功能

Spring结合自定义注解实现 AOP 切面功能 Spring AOP 注解概述Aspect 快速入门execution 切点表达式 拦截指定类的方法Pointcut("annotation(xx)") 拦截拥有指定注解的方法环绕通知 实现开关目标方法案例1:自定义注解切面实现统一日志处理1.自定义日志注解…

Mysql数据库 3.SQL.DDL语句

DDL数据库基本操作 查询所有数据库 show databases; 创建数据库 create database[if not exists]数据库名[default charset 字符集][collate 排序规则] 判断如果已经存在就加入[if not exists] 删除数据库 drop database [if exists] 数据库名 使用数据库 use 数据库名;…

Turf处理等压线

Turf是一个用于空间分析的JavaScript库。它包括传统的空间操作、用于创建GeoJSON数据的辅助函数以及数据分类和统计工具。Turf可以作为客户端插件添加到您的网站,也可以使用Node.js在服务器端运行Turf。 Turf是一个模块化的js类库,所有的模块都是在packa…

前端开发 vs. 后端开发:编程之路的选择

文章目录 前端开发:用户界面的创造者1. HTML/CSS/JavaScript:2. 用户体验设计:3. 响应式设计:4. 前端框架: 后端开发:数据和逻辑的构建者1. 服务器端编程:2. 数据库:3. 安全性&#…

冲刺十五届蓝桥杯P0002 日期统计

文章目录 题目分析代码 题目 分析 需要明白一些概念,子序列、连续子序列。 1.子序列(subsequence)是指原始序列中按照相同顺序选择零个或多个元素而形成的序列。连续子序列(subarray)是指原始序列中相邻位置的元素构…

使用领域引导图卷积神经网络GCNN增强基于脑电图EEG的神经疾病诊断完整代码

一种基于图卷积神经网络(GCNN)的新方法,用于改进使用头皮脑电图(EEG)进行神经系统疾病诊断。尽管脑电图是神经系统疾病诊断中主要使用的检测方法之一,但基于EEG的专家视觉诊断的敏感性仍然只有约50&#xf…

【Redis】Redis做为缓存,MySQL如何与Redis保持数据一致

Redis的作用 一般情况下Redis是用来实现应用和数据库之间的一个读操作的缓存层,主要目的是减少数据库的io,还可以提升数据库io性能 方法一: 先更新MySQL数据库,再删除缓存,再从数据库查询到的最新的数据同步到redis…

面试总结之Spring篇

一、AOP 1、什么是AOP 1.1、概述 AOP(Aspect-Oriented Programming):面向切面编程,即把一些业务逻辑中的相同代码抽取出来,让业务逻辑更加简练清爽 如果要CRUD写一堆业务,可如何实现业务代码前后进行打印…

如何使用ArcGIS Pro自动矢量化道路

对于已经制作好的电子地图,我们可以通过像素识别的方式将其中的要素提取出来,比如本教程要讲到的道路数据,这里为大家介绍一下在ArcGIS Pro中如何自动矢量化道路,希望能对你有所帮助。 栅格计算 在工具箱中点击“Spatial Analys…

odoo16 取消“系统各功能状态日报”的邮件

odoo16默认情况下每周都会发送一个“系统各功能状态日报”的邮件,而且是所有人都发, 这个功能在哪配置呢? 今天研究了一下, 线索是“系统各功能状态日报”,先全文检索吧 #. module: digest #: model:digest.digest,na…

构建个人云存储:本地电脑搭建SFTP服务器,开启公网访问,轻松共享与管理个人文件!

本地电脑搭建SFTP服务器,并实现公网访问 文章目录 本地电脑搭建SFTP服务器,并实现公网访问1. 搭建SFTP服务器1.1 下载 freesshd 服务器软件1.3 启动SFTP服务1.4 添加用户1.5 保存所有配置 2. 安装SFTP客户端FileZilla测试2.1 配置一个本地SFTP站点2.2 内…

深度学习(1)---卷积神经网络

文章目录 一、发展历史1.1 CNN简要说明1.2 猫的视觉实验1.3 新认知机1.4 LeNet-51.5 AlexNet 二、卷积层2.1 图像识别特点2.2 卷积运算2.3 卷积核2.4 填充和步长2.5 卷积计算公式2.6 多通道卷积 三、池化层 一、发展历史 1.1 CNN简要说明 1. 卷积神经网络(Convolut…