基于.Net Core实现的飞书所有文档一键导出服务(支持多系统)

feishu-doc-export

一个支持Windows、Mac、Linux系统的飞书文档一键导出服务,仅需一行命令即可将飞书知识库的全部文档同步到本地电脑。导出速度嘎嘎快,实测700多个文档导出只需25分钟,且程序是后台挂机运行,不影响正常工作。

动机

最近也是公司办公软件从飞书切换回了企业微信,自然就产生了一些文档要迁移的问题,由于文档量过多(大概有700多个),无论是从飞书手动下载为Word或PDF格式的文档,还是将内容复制到本地新建Markdown文件都是一件极为繁琐的事情。于是便找到了两个GitHub上已有的飞书文档导出工具Feishu2MDfeishu-backup,但是他们都有一些问题不太满足我的需求。

现有方案的不满足

feishu-backup:

官方地址:dicarne/feishu-backup: 用于备份飞书文档,可以将飞书文档转成markdown下载。 (github.com)

  1. 因为它是网页版,下载速度太慢。有一次使用线上版选择了其中一个飞书文档节点下的所有文档(大概200-300个),下载了1个多小时还没有好,可能是卡死了。

  2. 因为它的下载方式是把选择的全部文档打包成压缩包后才会在浏览器返回给你,如果这个等待的过程中途断网或者电脑卡顿要重启,那你就白等那么长时间了。

  3. 因为它不支持下载表格类型的文档。

feishu2md:

官方地址:Wsine/feishu2md: 一键命令下载飞书文档为 Markdown (github.com)

我虽然没用实际使用过它,但我阅读它的官方文档后发现它的核心问题是一次只能下载一个文档。

我的需求

  • 一次导出知识库下的所有文档,包含文档和表格
  • 导出的文档目录结构保持和原飞书文档一致
  • 导出速度不要太慢
  • 对于文档导出的格式没有要求,docxxlsx即可

基于以上的种种原因呢,我决定自己动手写一个满足自己需求的程序来解决这个问题。这里我使用的是支持跨平台的.net core进行开发,最终打包程序可支持在windowslinuxmac系统上运行。这里将不赘述具体的实现过程,直接展示最终的效果图吧。

如何使用

获取AppId和AppSecret

  • 进入飞书开发者后台,创建企业自建应用,信息随意填写。进入应用的后台管理页
  • (重要)打开权限管理,开通需要的权限:云文档>开通以下权限(注意有分页)
    • 查看新版文档
    • 查看、评论和下载云空间中所有文件
    • 查看、评论和导出文档
    • 查看、评论、编辑和管理云空间中所有文件
    • 查看、评论、编辑和管理多维表格
    • 查看、编辑和管理知识库
    • 查看、评论、编辑和管理电子表格
    • 导出云文档
  • 打开添加应用能力,添加机器人
  • 版本管理与发布中创建一个版本,并申请发布上线
    • 等待企业管理员审核通过
    • 如果只是为了测试,可以选择测试企业和人员,创建测试企业,绑定应用,切换至测试版本
      • 进入测试企业创建知识库和文档
  • 为机器人添加知识库的访问权限,具体步骤如下:
    • 在飞书桌面客户端中创建一个新的群组或直接使用已有的群组
    • 为群组添加群机器人,选择上面步骤中自己创建的应用作为群机器人
    • 打开知识库,如果你是知识库管理员,则可以看见知识空间设置。打开知识空间设置>成员管理>添加成员,选择刚刚建立的群组
  • 回到开发者平台,打开凭证与基础信息,获取 App IDApp Secret

下载程序

v0.0.2.1版本为第一个正式发布版本,从v0.0.2.1往后迭代的每一个版本都将提供免安装的可执行程序。下载地址:(Releases)feishu-doc-export

  • windows-x64系统,下载feishu-doc-export-win-x64.zip

  • mac-osx-x64系统,下载feishu-doc-export-mac-osx-x64.zip

  • linux-x64系统,下载feishu-doc-export-linux-x64.zip

下载并解压即可得到程序可执行文件,windows环境的可执行文件为feishu-doc-export.exelinuxmac环境的可执行文件为feishu-doc-export没有后缀。

命令行执行

在可执行文件的目录打开终端,命令行所有参数如下:

请填写以下所有参数:--appId           飞书自建应用的AppId.--appSecret       飞书自建应用的AppSecret.--spaceId         飞书导出的知识库Id(可为空,或者不传此参数).--exportPath      文档导出的目录位置.
  • win环境

    # 指定知识库导出
    ./feishu-doc-export.exe --appId=111111 --appSecret=2222222  --spaceId=333333 --exportPath=E:\temp\测试飞书文档
    # 不指定知识库导出
    ./feishu-doc-export.exe --appId=111111 --appSecret=222222 --exportPath=E:\temp\测试飞书文档
    
  • linux环境和mac环境

    **注意!!!**首次使用时需要将文件授权为可执行文件

    # 将文件授权为可执行文件
    sudo chmod +x ./feishu-doc-export
    

    执行时最好使用sudo,否则可能出现权限不足,导致在保存文档时无法创建文件目录

    # 执行不指定知识库的导出
    sudo ./feishu-doc-export --appId=111111 --appSecret=222222 --exportPath=/home/ubuntu/feishu-document
    

执行效果图如下:

逐步执行

  1. 第一步,(win,mac)双击运行程序,输入飞书自建应用的配置,并输入文档要导出的目录位置。

    maclinux仍需执行命令sudo chmod +x ./feishu-doc-export来将文件设置为可执行文件。

    mac可能会出现不受信任的执行程序,需要手动覆盖“隐私与安全性”设置中的设置。linux则只能通过命令行输入.\feishu-doc-export而不带参数的方式执行

  2. 第二步,选择知识库后自动导出

    在这里插入图片描述

  3. 第三步,对比飞书原文档的目录结构

耗时测试

700多个文件导出到本地总耗时25分钟

总结

自己动手,丰衣足食,有趣且实用。不过目前我的方案不支持的功能有以下几点,以后有空了再增强

  • 不支持将文档导出为Markdown格式
  • 不支持单独导出一个文档
  • 不支持单独导出某个子节点下的所有文档

所以呢,目前我写的这个程序只适用于不要求将文档导出为Markdown的群体使用。

开源地址

点击跳转到源码地址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/18305.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用html+javascript打造公文一键排版系统4:一级标题排版

完成公文标题的排版后,我们要进行对正文中的标题进行处理。 一般正文中的标题分为四级,文中结构层次序数依次可以用“一、”“(一)”“1.”“(1)”标注;一般第一层用黑体字、第二层用楷体字加粗…

《UNUX环境高级编程》(8)进程控制

1、引言 2、进程标识 每个进程都用一个唯一的非负整数标识,即为进程id:pid。进程ID是可以复用的,当一个进程终止时,其进程ID就可以用来标识其他进程。系统中有一些专用进程: 进程ID为0的是调度进程,也称交…

lua 请求ftp服务器数据,下载文件

1、装入ftp库 2、调用ftp的get()方法 3、get()方法参数格式: 4、将返回到的数据写入文件中 例如,本次获取专利数据系统 http://patdata1.cnipa.gov.cn/ 的ftp站点数据 local ftp require("socket.ftp")--此处我没填端口号 file,err ftp.g…

postgrep 9.4 断电后启动不了

journalctl -xe1、问题1:pg_ctl: another server might be running pg_ctl: another server might be running 解决方法:删除原来没有删除的pid文件 rm /opt/PostgreSQL/9.4/data/postmaster.pid 2、问题2 postgres文件丢失 - Unit postgresql-9.4.ser…

使用echarts+echarts-gl绘制3d地图,实现地图轮播效果

记录一下大屏开发中使用到的echarts-gl大屏的页面根据需求前前后后改了几个版本了,地图的样式也改了又改这里记录一下,因为echarts属性用到的比较多也比较杂,防止以后需要用到忘记了 目录 初始效果 效果图: 适应大屏风格的发光…

Centos7离线模式安装Redis6.2.13详细步骤(rpm方式)

本篇文章主要介绍在CentOS7服务器中安装Redis6.2.13,前提是需要有gcc的环境,那么在此我也会向大家介绍gcc的详细安装过程,参考了很多其它相关博客,但有些博主的文章可能是搬运的,导致我在实操时出现报错,那…

机器学习28:《推荐系统-I》概述

在互联网领域,推荐系统(Recommendation Systems)的应用非常广泛。在音视频方面,如抖音、快手、哔哩等;在电商平台方面,如京东、淘宝、拼多多等。推荐有助于帮助用户快速发现潜在感兴趣的内容(音…

设计模式之二:观察者模式

假定我们需要为Weather-O-Rama公司建立一个气象站系统,除已有的WeatherData有数据源类,还需要更新三个布告板的显示:目前状况(温度、湿度、气压)、气象统计和天气预报。 1 以下是一个可能的实现 class WeatherData { …

C++类相关概念

1. 函数形参默认值 (1) 建议函数(不仅仅是构造函数)形参默认值只在函数声明中指定; (函数声明和定义写在同一个文件中,则函数声明、定义两者之一或两者都可指定形参默认值,两者都指…

云原生监控——VictoriaMetrics

1.简介 VictoriaMetrics是一个快速高效且可扩展的监控解决方案和时序数据库,可以作为Prometheus的长期远端存储,具备的特性有: 支持prometheus查询api,同时实现了一个metricsql 查询语言支持全局查询视图,支持多prom…

在OK3588的Ubuntu系统上安装Firefox浏览器

文章目录 概要配置上网环境安装的具体命令 概要 因为Ubuntu系统里面没有安装浏览器,为了方便使用,提高工作效率,我们安装一下Firefox浏览器。 Firefox是一款适用于Ubuntu系统的免费和开源的Web浏览器。由Mozilla Foundation和其子公司Mozil…

生成图片验证码-Google Kaptcha

CaptchaImage生成 验证码 图片 captchaProducerMath.createText() 类似 captchaProducer.createText() 混合带字符的char如下 从若依学的,先看他的引用方式 package com.ruoyi.web.controller.common;import java.awt.image.BufferedImage; import java.io.IOExcept…