Dify+Notion本地化打造专属知识库

news/2025/2/20 10:30:05/文章来源:https://www.cnblogs.com/JavaEdge/p/18719803

创建知识库并上传文档大致分为以下步骤:

通过上传本地文件、导入在线数据或创建一个空的知识库。

1 导入文本数据

轻点 Dify 平台顶部导航中 “知识库” → “创建知识库”

可上传本地文件、导入在线数据两种方式上传文档至知识库内。

1.1 上传本地文件

拖拽或选中文件进行上传,支持批量上传,同时上传的文件数量限制取决于订阅计划:

本地上传文档文件的限制:

  • 单文档上传大小限制≤ 15MB
  • 不同 SaaS 版订阅计划限定批量上传个数、文档上传总数、向量存储空间

1.2 导入在线数据

支持导入以下两种在线数据:

1.2.1 从 Notion 导入数据

Dify知识库支持从 Notion 导入,并支持后续的数据自动同步。点击“去绑定”:

① 授权验证
  • 点击 同步自 Notion 内容-- 去绑定,根据提示完成授权验证。
  • 也可:进入 设置 -- 数据来源 -- 添加数据源 中点击 Notion 来源 绑定 ,完成授权验证

完成 internal 类型集成后,点击“绑定”即可:

② 导入 Notion 数据

需要将想要同步的文章关联到对应的 Integrations 中

  • 在对应的工作空间下,打开一篇想要同步的文章
  • 点击右上角的菜单项,选择「Connects」,在里面选择刚刚我们创建的 Integrations「Dify DataSource」

确认:

同步:

回到创建知识库的页面,点击同步自 Notion 内容,选择需要的授权页面进行导入:

③ 分段和清洗

选择知识库的分段设置索引方式保存并处理。等 Dify 自动处理数据。Dify:

  • 不仅可导入 Notion 的普通类型页面
  • 也支持导入并汇总保存 database 类型下的页面属性

暂不支持导入图片和文件,表格类数据会被转换为文本展示。

预览 Notion 页的分段结果

④ 同步 Notion 数据

如你的 Notion 内容有更新,可以在知识库的 文档列表页中点击对应内容页的 同步 按钮进行数据同步。同步文档涉及嵌入过程,因此将消耗嵌入模型的 Tokens。

img

同步 Notion 内容

⑤ 社区版Notion internal集成配置

Notion分:

  • 内部集成(internal integration)
  • 外部集成(public integration)

两种方式,两种集成方式区别Notion 官方文档。先创建集成。默认,所有集成都以内部集成开始;内部集成将与你选择的工作区相关联,因此你需要是工作区所有者才能创建集成。

类型默认内部Internal,选择关联的空间,输入集成名称并上传 logo 后,点击“保存”,集成创建成功:

点击“配置集成设置”:

创建集成后,按需在 Capabilities 选项卡下更新其设置,并在 Secrets 下点击 “Show” 按钮然后复制 Secrets:

复制后回到 Dify 源代码下,在 .env 文件里配置相关环境变量:

NOTION_INTEGRATION_TYPE = internal or NOTION_INTEGRATION_TYPE = public
NOTION_INTERNAL_SECRET=you-internal-secret

修改好后,执行以下命令并重启容器:

docker-compose down
docker-compose up -d

再次访问知识库并选中「同步自 Notion 内容」时就可以看到咱们已经集成成功。

本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!

  • 🚀 魔都架构师 | 全网30W+技术追随者
  • 🔧 大厂分布式系统/数据中台实战专家
  • 🏆 主导交易系统亿级流量调优 & 车联网平台架构
  • 🧠 AIGC应用开发先行者 | 区块链落地实践者
  • 🌍 以技术驱动创新,我们的征途是改变世界!
  • 👉 实战干货:编程严选网

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/885481.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

oracleRAC11g升级到19c详细操作步骤

升级oracle11g集群到19.3 前述环境检查: [root@qhdb1 ~]# crsctl status res -t -------------------------------------------------------------------------------- NAME TARGET STATE SERVER STATE_DETAILS ------------------------------------------------------------…

【深度学习】使用Miniconda进行python深度学习编程环境迁移

上pyhton深度学习的编程课,如果你是一线教师,你几乎经常会遇到这样的问题“同样的程序,学生在自己的电脑上运行报错”,多半是python相关的第三方包的版本问题导致。 今天我们就讲讲如何从根本上解决这个问题,确保学生在自己的电脑上和机房的电脑上有相同的实践结果。前提:…

getting-started/hello-world | hello world

将VContainer集成到应用程序中的基本方法是:在场景中创建一个继承自LifetimeScope的组件。它有一个容器和一个作用域。 在LifetimeScope的子类中使用C#代码注册依赖项。这是组合根。 当播放场景时,LifetimeScope会自动构建容器并将其分发到自己的PlayerLoopSystem中。:::note…

赶上AI的大潮:在VSCode中使用DeepSeek编程的极简方法

1 赶上AI的大潮:在VSCode中使用DeepSeek编程的极简方法 1.1 背景DeepSeek在春节期间突然大行其道,欣喜国力大增的同时,对于普通IT工作者,如何才能享受这一波AI红利,让自己的工作更出彩呢?  很多人在大量的宣传攻势下都知道了DeepSeek官网,然而当大家兴冲冲的来到DeepS…

about/VContainer是什么

VContainer import {BenchmarkGraph} from "../../src/components/BenchmarkGraph" import {GCAllocGraph} from "../../src/components/GCAllocGraph" VContainer 是 Unity 游戏引擎中极快的 DI(依赖注入)工具。"V" 意味着让 Unity 的初始 &q…

vue打包项目后,宝塔面板里的Nginx下的接口反向代理如何设置?

场景描述: vue开发H5页面过程中,需要用到加密解密接口,以及一系列反向代理配置。配置文件一般为——vue.config.js ; 如下:const path = require(path); let zipName = sdbf-h5; module.exports = {css: {loaderOptions: {sass: {implementation: require(sass), // 使用 d…

【Pytorch】深度学习-day01

【Pytorch2.0 版本介绍】- 是一个用于机器学习和深度学习的开源深度学习框架- 完全向下兼容,不论是新手,还是已经用过多年,有成熟项目,都可以完美升级到2.0 【安装-配置】下载地址:https://pytorch.org/ 版本选择:gpu/cpu版本,目前pytorch的gpu版本仅支持英伟达的显卡…

MyBatisCodeHelper Pro 3.2.4激活

去Jetbrains插件市场下载对应3.2.4版本 https://plugins.jetbrains.com/plugin/9837-mybatiscodehelperpro/versions/stable 2.安装 英文中文翻译3.下载jar包 https://i-blog.csdnimg.cn/direct/03908cc038b14bc2a0a2555c63226b4b.gif (来源:https://blog.csdn.net/GOODter/ar…

《Indie Tools • 半月刊》第001期

《INDIE TOOLS》专注于分享独立开发出海精选、最新、最实用的工具。 欢迎订阅半月刊:《INDIE TOOLS • 半月刊》 如果本文能给你提供启发和帮助,感谢各位小伙引言:独立开发者工具分享 《INDIE TOOLS》专注于分享独立开发出海精选、最新、最实用的工具。 欢迎订阅半月刊:《I…

在QJ7 手动执行自动化测试

https://wiki.one.int.sap/wiki/display/Joule/Development-+and+Test-Landscape 1: 申请加入user group 2: 使用joule login 查看登录到central joule instance的信息。 点击 service key 的URL, 查看service key和 secret 3: 登录 central joule instance4: 执行测试:本…

Dynamics 365 Online通过OAuth 2 Client Credential授权(Server-to-Server Authentication)后调用Web API

本文很多内容来自 John Towgood 撰写的 Dynamics 365 Online Authenticate with Client Credentials ,也着重参考了官方的 Use Single-Tenant server-to-server authentication ,我根据新的Azure Portal界面做了一些操作上的变化,并且改了一些代码,还使用ADAL来简化代码。 …

【转载】在Visual Studio 2015中添加报表功能 (使用 VS2015打开c#项目,新建文件没有报表选项,或者打开已有的wsdl不能打开设计器 )

Visual Studio 2015默认安装时没有报表,这时需要添加Microsoft Office 开发人员工具、Microsoft SQL Server Data Tools选项,安装之后就可以显示报表了,具体操作如下。方法/步骤 双击Visual Studio 2015的安装程序图标,启动软件安装向导。 在Visual Studio软件安装向导对话…