python—如何提取word中指定内容

        假设有一个Word,该Word中存在 “联系人” 关键字,如何将该Word中的联系人所对应的内容提取出来呢?  该Word内容如下所示:       

      
        要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

import docx# 加载Word文档
doc = docx.Document('your_document.docx')# 存储提取的内容
contacts = []# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:# 获取关键字后面的内容contact = paragraph.text.split('联系人', 1)[1]contacts.append(contact.strip())# 显示提取的内容
for contact in contacts:print(contact)

        在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

        运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

        确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

pip install python-docx
        通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为:

联系人:张三
联系人:李四
联系人:王五

 若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:target_content.append(paragraph.text)elif '电话' in paragraph.text:target_content.append(paragraph.text)

添加之后程序运行结果: 

联系人:张三
电话:153***55899
联系人:李四
电话:139***08783
联系人:王五
电话:139***52328

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/127949.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

详解链表oJ<反转链表,链表的中间节点及链表的回文>

hello,大家好,这里是Dark FlameMaster,今天和大家分享的是有关数据结构链表的几道题目,链表的中间节点,反转链表及判断链表是否为回文结构,放在一起讲解会印象更加深刻。 文章目录 一,链表的中间节点二&…

你的librosa和scikit-learn打架了吗?

被这个问题困扰好久!!!!!!!!!!!!!! 我的原来版本librosa0.7.1 和 scikit-learn1.3.1 一直拆了按,按…

【力扣每日一题】2023.10.7 股票价格跨度

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 给我们一个数组表示不同时间的股票的价格,要我们按照顺序返回每天的股票价格跨度,价格跨度就是股票价格小于或等于…

Python3操作Redis最新版|CRUD基本操作(保姆级)

Python3中类的高级语法及实战 Python3(基础|高级)语法实战(|多线程|多进程|线程池|进程池技术)|多线程安全问题解决方案 Python3数据科学包系列(一):数据分析实战 Python3数据科学包系列(二):数据分析实战 Python3数据科学包系列(三):数据分析实战 Win11查看安装的Python路…

C#练习题-构造函数

文章目录 前言题目习题1运行示例 习题2运行示例 参考答案习题1习题2 其他文章 前言 本篇文章的题目为C#的基础练习题,构造函数部分。做这些习题之前,你需要确保已经学习了构造函数的知识。 本篇文章可以用来在学完构造函数后加深印象,也可以…

HTTPS工作过程,国家为什么让http为什么要换成https,Tomcat在MAC M1电脑如何安装,Tomcat的详细介绍

目录 引言 一、HTTPS工作过程 二、Tomcat 在访达中找到下载好的Tomcat文件夹(这个要求按顺序) zsh: permission denied TOMCAT的各部分含义: 引言 在密码中一般是:明文密钥->密文(加密) &#xff…

分布式数据库(林子雨慕课课程)

文章目录 4. 分布式数据库HBase4.1 HBase简介4.2 HBase数据模型4.3 HBase的实现原理4.4 HBase运行机制4.5 HBase的应用方案4.6 HBase安装和编程实战 4. 分布式数据库HBase 4.1 HBase简介 HBase是BigTable的开源实现 对于网页搜索主要分为两个阶段 1.建立整个网页索引&#xf…

必备的常见芯片封装

-网友:这什么破封装,这么难焊! -工程师:你才焊过几种芯片封装呀,SOT封装都觉得难? 我们常见的芯片封装: 第一种,DIP封装,DIP即双列直插式封装,引脚从芯片两…

三十二、【进阶】hash索引结构

1、hash索引结构 (1)简述: hash索引,就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。 (2)图示: 2、hash索引结构…

Scratch3.0下载

通俗易懂,直接上链接 链接:https://pan.baidu.com/s/1n-QFEQWT8im8BHQu1wIjtg?pwd1016 提取码:1016

.some方法、vh、多列布局、DNS域名解析过程、空页面文字内容渲染

nodeEndTime.some((time) > !!time) 这个方法主要用来判断nodeEndTime这个数组中是否有至少一个非假值的元素。它会遍历 nodeEndTime 数组中的每个元素,如果至少有一个元素是真值(不是 null、undefined、0、false 或空字符串等假值&#x…

文献综述|CV领域神经网络水印发展综述

前言:最近接触了「模型水印」这一研究领域,阅读几篇综述之后,大致了解了本领域的研究现状,本文就来总结一下该领域的一些基础知识,以飨读者。 ⚠️注:本文中出现的研究工作均基于计算机视觉任务开展&#x…