目录
- 🍑一、概述
- 🍊1.1、pdi-ce-9.4.0.0-343.zip
- 🍊1.2、pentaho-server-ce-9.4.0.0-343.zip
- 🍑二、简单使用
- 🍊2.1、pdi-ce-9.4.0.0-343
- 🍊2.2、pentaho-server-ce-9.4.0.0-343
- 🍊2.3、联合使用
- 🍑三、总结
- 🍊问题:Spoon界面的Connect按钮不见了
🍑一、概述
Pentaho Data Integration
(PDI
) 是一个开源的数据集成工具,以前被称为 Kettle
。它主要用于处理数据的抽取、转换和加载(ETL
)过程,使组织能够轻松地从各种数据源收集数据,对其进行清洗、转换和聚合,然后将结果加载到目标系统中。
昨天部署了Linux部署Kettle(pentaho-server-ce-9.4.0.0-343)记录/配置MySQL存储,今天再来了解一下如何使用。
🍊1.1、pdi-ce-9.4.0.0-343.zip
pdi-ce-9.4.0.0-343.zip
文件是 Pentaho Data Integration
社区版 (Community Edition, CE
) 的数据集成版本安装包。这个 ZIP 文件包含了 PDI
的核心组件,包括:
Spoon
:这是一个图形化界面工具,用于设计和执行数据转换任务。Pan
:这是一个命令行工具,用于在没有图形用户界面的情况下运行数据转换任务。Kitchen
:这是一个命令行工具,用于执行包含多个转换的任务作业。
通过这些工具,您可以创建、编辑、测试和调度数据处理工作流。PDI 支持广泛的数据源和目标,包括关系型数据库、平面文件、Excel、Hadoop 等,并提供了丰富的转换步骤来处理数据。
🍊1.2、pentaho-server-ce-9.4.0.0-343.zip
pentaho-server-ce-9.4.0.0-343.zip
是 Pentaho Business Analytics Server
社区版 (Community Edition, CE
) 的一个特定版本安装包。这个 ZIP 文件包含了用于部署和运行 Pentaho BI
服务器所需的所有文件。Pentaho BI Server
是一个开源的商业智能平台,它提供了仪表板、报表、分析和数据集成等功能。BI Server
支持用户创建、管理和共享业务分析内容,帮助组织从各种数据源中提取价值。
这个安装包之所以大(超过1GB),是因为它包含了很多组件:
Web 应用程序
:包括所有用于构建和展示仪表板、报表和其他 BI 内容的 Web 应用程序。Tomcat
:一个开源的 Java Servlet 容器,用于托管 Pentaho BI Server。Pentaho Data Integration (Kettle)
:用于 ETL(抽取、转换和加载)过程的工具,如前所述。示例数据和文档
:提供给用户学习和测试使用的一些示例数据集以及关于如何使用 Pentaho BI Server 的文档。插件和扩展
:Pentaho 平台支持大量可选的插件和扩展,这些可能也会包含在安装包中。
由于 Pentaho BI Server 非常强大,并且可以处理多种类型的数据源和目标,所以它的安装包相对较大。如果您只需要使用 PDI 进行数据集成,那么您可以单独下载 pdi-ce-9.4.0.0-343.zip,而不需要完整的 BI Server。
🍑二、简单使用
🍊2.1、pdi-ce-9.4.0.0-343
- 右键创建作业
- 拖动节点到作业当中,以shell为例
- 双击任务节点进行编辑
- 点击运行
- 必须要有一个开始节点才能正常运行
- 再次保存运行
🍊2.2、pentaho-server-ce-9.4.0.0-343
登录web端,尝试点击了一遍,没感觉到有啥用呢?还是说开源版开放的功能少?
- 视图这里可以切换语言和主题
- 尝试新建数据源
- 浏览文件
就这?没了????
🍊2.3、联合使用
-
spoon
连接pentaho-server
-
创建运行作业
-
登录web端查看作业
-
查看服务端日志,可以看到作业运行情况
-
web端创建的数据库,本地连接之后,可以直接使用
🍑三、总结
pentaho-server
包很大,据说功能比较丰富全面,但是web端页面,比较简单,可以创建管理数据源,客户端连接后便可以使用,客户端创建的作业,web端也能看到,但是看不到作业详情,其它功能就没看到了,不知道是不是还需要什么配置,今天到这吧,好像三阳了🤧😢😭
🍊问题:Spoon界面的Connect按钮不见了
直接删除下面文件,重启Spoon,注意:会清除掉原先的连接记录