用python提取word中的所有图片

        使用word中提取的方式图片会丢失清晰度,使用python写一个脚本,程序运行将弹出对话框选择一个word文件,然后在弹出一个对话框选择一个文件夹保存word中的文件。将该word中的所有图片都保存成png格式,并命名成image_i的样式。

程序运行步骤如下图所示:

代码:

其中,save_images_from_word函数介绍如下:

  • docx_file:一个字符串,表示要处理的Word文档的路径。
  • output_folder:一个字符串,表示要将图片保存到的文件夹路径。
  1. 使用python-docx库打开给定的Word文档,并将其内容存储在doc对象中。
  2. for i, rel in enumerate(doc.part.rels.values())::遍历文档中的所有关系。每一个关系rel都代表文档中的一个链接或嵌入的对象。通过enumerate函数,我们可以同时获得关系的索引i和关系对象本身。
  3. if "image" in rel.reltype:
    检查当前的关系是否是一个图片。rel.reltype是一个字符串,表示关系的类型。如果这个字符串中包含"image",则表示这是一个图片关系。
  4. image_bytes = rel.target_part.blob
    从图片关系中获取图片的原始字节数据。这里,rel.target_part.blob表示图片的原始二进制数据。
  5. with open(os.path.join(output_folder, f"image_{i}.png"), "wb") as f:
    使用os.path.join函数构造保存图片的完整路径。这里使用了格式化字符串(f-string),将关系索引转换为"image_{i}.png"这样的文件名。例如,如果索引是0,则文件名为"image_0.png"。
  6. f.write(image_bytes)
    将图片的原始字节数据写入到刚刚打开的文件中。这样,图片就被保存为PNG格式的文件了。
##########################################
#选择一个word文件,在选择一个路径
#程序将所有word中的图片保存成png格式,
#并且命名为image_ifrom tkinter import Tk, filedialog  
from docx import Document  
import os  
import io
#from docx.shapes.picture import Picture
from PIL import Image  def save_images_from_word(docx_file, output_folder):doc = Document(docx_file)for i, rel in enumerate(doc.part.rels.values()):if "image" in rel.reltype:image_bytes = rel.target_part.blobwith open(os.path.join(output_folder, f"image_{i}.png"), "wb") as f:f.write(image_bytes)  
def select_file():  root = Tk()  root.withdraw()  file_path = filedialog.askopenfilename(filetypes=[("Word files", "*.docx")])  return file_path  def select_output_folder():  root = Tk()  root.withdraw()  output_folder = filedialog.askdirectory()  return output_folder  # 选择Word文件  
file_path = select_file()  
if file_path:  # 选择输出文件夹  output_folder = select_output_folder()  if output_folder:  # 保存图片到输出文件夹  save_images_from_word(file_path, output_folder)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/323724.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《知识扫盲》ROS和ROS2对比

文章摘选自:ROS与ROS2对比 1.ROS问题举例 ROS的设计目标是简化机器人的开发,如何简化呢?ROS为此设计了一整套通信机制(话题、服务、参数、动作)。 通过这些通信机制,ROS实现了将机器人的各个组件给的连接…

Prometheus-Alertmanage钉钉实现告警

获取钉钉的webhook地址 1、注册企业钉钉 a、注册企业钉钉 浏览器打开钉钉注册页面 填入手机号码,填入获取到的验证码,点注册 填入企业资料并注册 注册成功后,扫描二维码下载钉钉,如下图: b、添加机器人 管理后台 因…

[AutoSar]DaVinci Developer 命名规范

目录 关键词平台说明一、背景二、Component命名约定2.1Component Type Composition(CtCo)2.2Component Type Application( CtAp)2.3Component Type SensorActuator(CtSa)2.4Component Type Complex Driver&…

小型洗衣机哪个牌子质量好?五款内衣洗衣机便宜好用的牌子推荐

随着大家工作的压力越来越大,下了班之后只能想躺平,在洗完澡之后看着还需要手洗的内衣裤真的很头疼。有些小伙伴还有会攒几天再丢进去洗衣机里面一起,而且这样子是非常不好的,用过的内衣裤长时间不清洗容易滋生细菌,而…

pdf转换成word怎么转?一篇文章教你轻松搞定

pdf转换成word怎么转?你是否曾经遇到过需要将PDF文件转换成Word格式的情况?比如,你需要编辑一个文档,或者想将一些电子书或报告复制到Word中以便于编辑或重新排版。在这种情况下,如何将PDF文件转换成Word格式呢&#x…

过滤器亚马逊审核UL900报告标准

过滤器亚马逊审核UL900防火等级检测标准,要符合ISO17025资质实验室出具的报告才能成功的上架亚马逊平台。 过滤器(filter)是输送介质管道上不可缺少的一种装置,通常安装在减压阀、泄压阀、定水位阀 ,方工过滤器其它设备的进口端设备。过滤器…

申请CSDN博客专家的历程

今天是2024年第一周的周五下午13:55,我怀着非常非常激动的心情写下这篇博客记录这难忘的时刻:我的博客专家认证通过了!现在唯一想说的就是非常感谢CSDN平台,我会继续努力,把最好的分享给大家。 与CSDN的缘分…

ReactNative 常见问题及处理办法(加固混淆)

ReactNative 常见问题及处理办法(加固混淆) 文章目录 摘要 引言 正文ScrollView内无法滑动RN热更新中的文件引用问题RN中获取高度的技巧RN强制横屏UI适配问题低版本RN(0.63以下)适配iOS14图片无法显示问题RN清理缓存RN navigat…

数据结构—图(上)

文章目录 12.图(上)(1).图的基本概念#1.图的基本定义#2.边的分类#3.数据结构的一些规定#4.子图#5.完全图#6.路径#7.连通性和连通分量#8.度 (2).图的存储方式#1.邻接矩阵#2.邻接表 (3).图的遍历#1.深度优先搜索(Depth First Search)i.走个迷宫ii.DFS的思想iii.代码实现 #2.广度优…

IDAPython详细版(二)

六:操作数 可以使用idc.get_openrand_typed(ea,n)得到操作数的类型。ea是地址,n是索引 这里有8种不同类型的操作数类 0_void 如果一个指令木有任何操作数它将返回0 0_reg 如果一个操作数是一个普通的寄存器将返回此类型。这个值在内部表示为1. o_mem …

数据分析求职-岗位介绍

这是咱们干货开始的第一篇文章,后续我尽量会保持日更的节奏和大家做分享~ 在未来所有分享的内容展开之前,咱们有必要先彻底、深入地了解下数据分析这个岗位。如果你还在犹豫是否要走数据分析的路,或者你已经拿了数据分析的offer想了解下将来…

nuScenes数据集解压

下载Full dataset(v1.0)的Trainval和Test部分,放到data/nuscenes文件夹下 如果下载了Map expansion,则需要现在nuscenes下新建一个文件夹maps,把nuScenes-map-expansion-v1.3.zip解压到里面,可以使用unzip…