Python docx学习笔记

个人学习笔记。

1 工具介绍

python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具。

1.1 基本概念

  • Document:是一个 Word 文档 对象,不同于 VBA 中 Worksheet 的概念,Document 是独立的,打开不同的Word 文档,就会有不同的 Document 对象,相互之间没有影响。
  • Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段。
  • Run: 表示一个节段,每个段落由多个节段组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落对象有多个 Run 列表。
    在这里插入图片描述

1.2 对象介绍

此处只列出部分,剩余的部分,见官方文档介绍。

1.2.1 Document objects

整篇word文档的对象,可以对该对象添加标题、段落、表格、图片等信息。

在这里插入图片描述

1.2.2 Paragraph objects

段落对象,可以在段落里面添加一个节段、段落前添加一个段落(不支持在后面添加)、设置格式等。
在这里插入图片描述

1.2.3 Table objects

表格对象,常规的添加行、列、合并单元格等。
在这里插入图片描述

2 实操

实现功能:在word文档的指定位置添加相应的宏定义和函数定义

2.1 准备材料

word文档模板:
在这里插入图片描述
备注:
1、需要现在word文档中设置好自动编号(关联到相应标题)
2、相应标题格式(字体颜色、大小等)需要提前调整,脚本只是应用,占时不修改属性

2.2 运行结果

在这里插入图片描述

2.3 代码

from docx import Document
from docx.enum.table import WD_ALIGN_VERTICAL  # 导入单元格垂直对齐
from docx.shared import Cm, Inches, Pt
import reColumn = 4   # 设置表格列数
# 这里添加表格内容,具体内容后期提取代码或提前PDF文档
EnumInfo = [{'Name': 'Crypto_AlgorithmFamilyType', 'kind': 'Enumeration','Range': [['CRYPTO_ALGOFAM_NOT_SET', '0x00', 'Algorithm family is not set'],['CRYPTO_ALGOFAM_SHA1', '0x01', 'SHA1 hash'],['CRYPTO_ALGOFAM_SHA2_224', '0x01', 'SHA2-224 hash']],'Description': 'Enumeration of the algorithm family.', 'Availablevia': 'Crypto_GeneralTypes.h'},{'Name': 'Crypto_InputOutputRedirectionConfigType', 'kind': 'Enumeration','Range': [['CRYPTO_REDIRECT_CONFIG_PRIMARY_INPUT', '0x01', '--'],['CRYPTO_REDIRECT_CONFIG_SECONDARY_INPUT', '0x02', '--']],'Description': 'Defines which of the input/output parameters are re-directed to a key element. Thevalues can be combined to define a bit field.','Availablevia': 'Crypto_GeneralTypes.h'}]def addEnum(document, paragraph):for type in EnumInfo:paragraph1 = paragraph.insert_paragraph_before(type['Name'], style='Heading 3')lineNumber = 0table1 = document.add_table(4, Column, style='Table Grid')  # 添加一个4行4列的表格,表格样式为Table Gridtable1.autofit = Falsetable1.allow_autofit = False# 设置表格宽度table1.columns[0].width = Cm(2)table1.columns[1].width = Cm(4)table1.columns[2].width = Cm(1.5)table1.columns[3].width = Cm(8)# 设置第一行高度为1cmtable1.rows[0].height = Cm(1)# 填充Name信息table1.cell(lineNumber, 0).text = 'Name'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Name']lineNumber = lineNumber + 1# 填充Kind信息table1.cell(lineNumber, 0).text = 'kind'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['kind']lineNumber = lineNumber + 1# 填充具体的枚举数据for i in range(0, len(type['Range'])):table1.cell(lineNumber + i, 1).text = type['Range'][i][0]table1.cell(lineNumber + i, 2).text = type['Range'][i][1]table1.cell(lineNumber + i, 3).text = type['Range'][i][2]table1.add_row()lineNumber = lineNumber + len(type['Range'])  # 计算下一行的索引# 合并第一列表格(枚举相关的行)for i in range(2, lineNumber - 1):  # 总共需要合并lineNumber - 1次table1.cell(i, 0).merge(table1.cell(i + 1, 0))table1.cell(2, 0).text = 'Range'table1.cell(2, 0).vertical_alignment = WD_ALIGN_VERTICAL.CENTER  # 设置为水平居中# 填充Description、Availablevia信息table1.cell(lineNumber, 0).text = 'Description'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Description']lineNumber = lineNumber + 1table1.cell(lineNumber, 0).text = 'Availablevia'table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))table1.cell(lineNumber, 1).text = type['Availablevia']move_table_after(table1, paragraph1)  # 移动到段落后面(表格只能创建到文档末尾)
# 函数功能:移动指定表格到段落后面
def move_table_after(table, paragraph): tbl, p = table._tbl, paragraph._pp.addnext(tbl)def main():# 实例化一个Document对象,相当于打开word软件,新建一个空白文件document = Document('test.docx')for paragraph in document.paragraphs:if (paragraph.style.name.startswith('Heading')):  # 识别标题,注意:这里是在标题前添加相关信息,若要在枚举章节添加枚举定义,则需要识别下一个章节标题if re.search('函数接口定义', paragraph.text):   # 实际是编辑上一个章节“枚举类型定义”的内容passelif re.search('其他', paragraph.text):        # 编辑“函数接口定义内容”addEnum(document, paragraph)  # 添加枚举类型document.save(f"test.docx")if __name__ == "__main__":main()

3 参考资料

3.1 官方链接

https://python-docx.readthedocs.io/en/latest/index.html#

在这里插入图片描述
刚入门可以看该章节快速上手,具体API和对象的熟悉可以看下面的“API Documentation”。
在这里插入图片描述

3.2 其他博主

强烈推荐学习此博主的博文,本文部分内容从中摘选。

https://blog.csdn.net/yuetaope/article/details/119444970

4. 其他

Python提取PDF表格(基于AUTOSAR_SWS_CANDriver.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/527716.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 一步一步教你用pyglet制作汉诺塔游戏

目录 汉诺塔游戏 1. 抓取颜色 2. 绘制圆盘 3. 九层汉塔 4. 绘制塔架 5. 叠加圆盘 6. 游戏框架 汉诺塔游戏 汉诺塔(Tower of Hanoi),是一个源于印度古老传说的益智玩具。这个传说讲述了大梵天创造世界的时候,他做了三根金刚…

Python实现线性查找算法

Python实现线性查找算法 以下是使用 Python 实现线性查找算法的示例代码: def linear_search(arr, target):"""线性查找算法:param arr: 要搜索的数组:param target: 目标值:return: 如果找到目标值,返回其索引;否则返回 -1…

力扣中档题的简单写法:在链表中插入最大公约数

其实暴力遍历开数组也可以,但不如以下新建链表块的方法简单 int FindCommDivisor(int num1, int num2) {int n;int i;n fmin(num1, num2);for (i n; i > 1; i--) {if (num1 % i 0 && num2 % i 0) {return i;}}return 0; }struct ListNode *insertGr…

【考研数学】跟武忠祥老师,如何用好汤家凤1800题?

跟着武忠祥老师的课不代表你只能刷武忠祥老师的题 实际上武忠祥老师体系的题目是有一定的难度的,比如严选题,比如660题,大家可以发现这些题集不仅难,而且数量比较少。武忠祥老师的目的就是通过质量很高的题目,让大家掌…

架构学习总结:企业架构=业务+数据+技术+应用架构

最近再次研读DAMA数据管理知识体系,结合工作对什么是企业架构?如何开展企业架构设计工作有一些新的认识,供大家参考。企业架构包括企业的业务架构、数据架构、技术架构和应用架构,要想做好企业的信息化数字化建设规划,这四个架构都不可缺少,这四个方面的内容共同组成了企…

Vue:纯前端实现文件拖拽上传

先看一下拖拽相关的事件:dragover、dragenter drop和dragleave 。 dragover事件:当被拖动的元素在一个可放置目标上方时,该事件会被触发。 通常,我们会使用event.preventDefault()方法来取消浏览器默认的拖放行为,以便…

017集——圆弧(ARC)转多段线(lwpolyline)——cad vba 中按一定精度拟合加点实现

在国土资源管理项目中,我们经常会遇到CAD转gis数据实现入库,而cad中的arc圆弧转为gis数据只能转出弧的顶点坐标,导致图形变形失真。若一个一个对弧进行手工增加点转为多段线,耗时耗力,效率极其低下。这里给出解决方案&…

新书速览|FFmpeg开发实战:从零基础到短视频上线

资深音视频开发专家、畅销书作者重磅新作,从基础知识到高级应用,从桌面开发到移动开发,9大实际音视频项目完整再现 本书内容 《FFmpeg开发实战:从零基础到短视频上线》是一本FFmpeg开发的实战教程,由浅入深&#xff0…

十大排序算法(冒泡排序、插入排序、选择排序、希尔排序、堆排序、快排、归并排序、桶排序、计数排序、基数排序)

目录 一、冒泡排序: 二、插入排序: 三、选择排序: 四、希尔排序: 五、堆排序: 六、快速排序: 6.1挖坑法: 6.2左右指针法 6.3前后指针法: 七、归并排序: 八、桶…

F - Earn to Advance

解题思路 由于对于一点不知道后面得花费,所以无法决策当前是否要停下赚钱或要停下多久考虑一点,可以由其左上方的所有点到达所以从往前推,得出到的总花费然后考虑从之后不赚钱直接到最终所用次数和剩余钱若存在,在后面点赚钱更优…

【Web】浅聊Java反序列化之AspectJWeaver——任意文件写入

目录 简介 原理分析 EXP CC5改链 CC6改链 简介 pom依赖&#xff1a; <dependency><groupId>org.aspectj</groupId><artifactId>aspectjweaver</artifactId><version>1.9.2</version> </dependency> AspectJWeaver 是 …

【Python】Python注册微服务到nacos

Python注册微服务到Nacos 1.Nacos部署 github 的nacos项目的发布页&#xff08;Releases alibaba/nacos GitHub &#xff09;&#xff0c;选择所要下载的nacos版本&#xff0c;在nacos下方的assets中选择安装包进行下载。 解压nacos安装包到指定目录。 tar -zxvf nacos-ser…