基于springboot的java读取文档内容(超简单)

     读取一个word文档里面的内容,并取出来。

代码:

 @SneakyThrows@GetMapping(value = "/readWordDoc")@ApiOperationSupport(order = 1)@ApiOperation(value = "文档读取 ", notes = "文档读取 ")public R ReadWordDoc () {System.out.println("进来了");String filePath = "F:\\\\工作\\\\测试\\\\测试文档2.doc"; // 替换为你的文档路径String text = "";StringBuffer text2 = new StringBuffer();try (FileInputStream fis = new FileInputStream(filePath)) {// 使用FileInputStream打开Word文档XWPFDocument document = new XWPFDocument(fis);// 读取段落内容List<XWPFParagraph> paragraphs = document.getParagraphs();for (XWPFParagraph para : paragraphs) {
//                text = para.getText(); // 获取段落内容text2.append(para.getText());}} catch (IOException e) {e.printStackTrace();}// FileInputStream和XWPFDocument资源会自动关闭System.out.println(text2); // 输出内容return R.data(text2);}

输出结果:

代码解析:

1. `@SneakyThrows` 注解:这是一个Lombok注解,用于自动处理异常,可以将受检异常转换为不受检异常。

2. `@GetMapping(value = "/readWordDoc")` 注解:这是一个Spring MVC注解,指定了该方法处理的GET请求路径。

3. `@ApiOperationSupport(order = 1)` 注解:这是一个Swagger注解,用于设置接口的展示顺序。

4. `@ApiOperation(value = "文档读取 ", notes = "文档读取 ")` 注解:这是一个Swagger注解,用于设置接口的名称和说明。

5. `public R ReadWordDoc()` 方法:这是一个公共的无参方法,表示该方法的访问修饰符是public,返回类型是一个自定义的R类型。

6. `String filePath` 变量:用于存储Word文档的文件路径。

7. `String text` 和 `StringBuffer text2` 变量:分别用于存储文档内容。

8. `try (FileInputStream fis = new FileInputStream(filePath))`:使用Java 7的try-with-resources语法,创建一个FileInputStream对象,并设置文档路径。

9. `XWPFDocument document = new XWPFDocument(fis)`:创建一个XWPFDocument对象,表示Word文档。

10. `List<XWPFParagraph> paragraphs = document.getParagraphs()`:获取文档中的所有段落,返回一个包含XWPFParagraph对象的列表。

11. `for (XWPFParagraph para : paragraphs)`:遍历段落列表。

12. `text2.append(para.getText())`:使用StringBuffer对象将每个段落的文本内容添加到text2中。

13. `catch (IOException e)`:捕获IOException异常,打印异常信息。

14. `System.out.println(text2)`:输出文档内容。

15. `return R.data(text2)`:将text2作为响应数据,返回一个R对象。

为了使上述代码能够编译和运行,需要引入以下依赖:

1. Spring Boot相关依赖,包括`spring-boot-starter-web`、`spring-boot-starter`等,用于构建Web应用程序。

2. Swagger依赖,用于生成API文档,如`springfox-swagger2`和`springfox-swagger-ui`。

3. Apache POI依赖,用于处理Word文档,如`poi-ooxml`和`poi-ooxml-schemas`。

这些依赖可以在项目的构建工具(如Maven或Gradle)中进行配置,并在项目中进行引用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/324448.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue封装组件(一)标签和下拉框组合实现添加数据

背景: 最近接入短剧内容&#xff0c;需要添加短剧合作方。在详情页需要支持添加组件 方案一&#xff1a;标签tag加上输入框实现添加数据。图片见下 这个是刚开始做的&#xff0c;后来产品觉得这样会造成随意修改数据&#xff0c;需要改成下拉框形式添加 方案二&#xff1a;标签…

Springboot配置http-Only

项目框架 jdk1.8、springboot2.5.10 情况一 项目中未使用&#xff08;权限认证框架&#xff1a;Sa-Token&#xff09; application.yml文件内增加配置 server.servlet.session.cookie.http-onlytrueserver.servlet.session.cookie.securetrue (此条配置建议也加上) 情况二…

宝强前经纪人宋喆出狱后首露面;美团外卖平台KeeTa;电视开机率跌至30%;朝军发射200多枚炮弹

今日精选 • Gartner 预测&#xff1a;到 2026 年全球 80% 的公司将在其业务中使用生成式 AI• 美团旗下外卖平台KeeTa在全港已有约31%市场占有率• 我国电视开机率跌至30%• 朝军发射200多枚炮弹 韩国发布避难令• 王宝强前经纪人宋喆出狱后首露面• 去年我国彩票销量超5796亿…

C++初级(三)

我们这里还是在C基础上进行对C基础语法的补充学习&#xff01; 一.C数组 C数组大体和C相同&#xff0c;但是C数组还是有一定的区别的。 我们先看看C和C数组共同的易错点知识&#xff1a; 1.数组只能一次初始化。 2.如果对数组只进行一部分初始化&#xff0c;那么其他未初始…

202402读书笔记|《当你老了》——灰蒙曙光比爱情温柔,清晨露珠比希望更可爱

202402读书笔记|《当你老了》——灰蒙曙光比爱情温柔&#xff0c;清晨露珠比希望更可爱 《当你老了》作者叶芝&#xff0c;断断续续碎片时间读完的一本书&#xff0c;不是很惊艳&#xff0c;但值得一读。就因为很喜欢当你老了&#xff0c;所以拾起的这本书。读完知道了原来叶芝…

javafx

JavaFX JavaFX简介 JavaFX是一个用于创建富客户端应用程序的图形用户界面&#xff08;GUI&#xff09;框架。它是Java平台的一部分&#xff0c;从Java 8开始成为Java的标准库。 JavaFX提供了丰富的图形和多媒体功能&#xff0c;使开发人员能够创建具有吸引力和交互性的应用程…

NLP电影情绪分析项目

https://machinelearningmastery.com/develop-word-embedding-model-predicting-movie-review-sentiment/ https://machinelearningmastery.com/prepare-movie-review-data-sentiment-analysis/ 本教程分为 5 个部分;他们是&#xff1a; 电影评论数据集数据准备训练嵌入层训练…

火力发电厂电高压系统电弧光保护监测设备

摘要&#xff1a;介绍了电弧光保护装置的组成,对火力发电厂高压厂用电系统保护的现状及存在的不足进行了分析,以一个典型的2300MW火力发电厂工程为例,讨论了高压厂用电系统电弧光保护装置的设计应用方案,对电弧光保护装置的应用前景进行了展望。1联5系8电2话171微3信5同2号2 关…

PCIe 6.0生态业内进展分析总结-2

3.PCIe 6.0协议分析仪 (1)Keysight Keysight是德科技在2023年6月份对外宣布&#xff0c;第一款支持PCIe 6.0协议验证调试工具。 Keysight PCIe 6.0架构解决方案具备以下特点&#xff1a; 分析PCIe 6.0技术设计的数据链路/事务层 支持所有PCIe技术速率——从2.5 GT/s至64 GT/…

每日一道算法题day-three(备战蓝桥杯)

哈喽大家好&#xff0c;今天来给大家带来每日一道算法题系列第三天&#xff0c;让我们来看看今天的题目&#xff0c;一起备战蓝桥杯 题目&#xff1a; 小 Y的桌子上放着 n 个苹果从左到右排成一列&#xff0c;编号为从 11 到 n。 小苞是小 Y 的好朋友&#xff0c;每天她都会…

Idea live template

1:打印入参日志的配置 log.info("$methodName$ 方法入参: $argsLog$",$argsJson$); methodName:methodName() argsLog:groovyScript( "def result; def params\"${_1}\".replaceAll([\\\\[|\\\\]|\\\\s], ).split(,).toList(); for(i 0; i <…

StreamPark + PiflowX 打造新一代大数据计算处理平台

&#x1f680; 什么是PiflowX PiFlow 是一个基于分布式计算框架 Spark 开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件&#xff0c;以所见即所得方式进行流水线配置。简单易用&#xff0c;功能强大。它具有如下特性&#xff1a; 简单易用…