Databend 的安装配置和使用

介绍

Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库,为 Snowflake 提供了具有成本效益的替代方案,专门对最大的数据集进行复杂分析而设计。

性能

  • 在存储对象上,能快速进行数据分析。
  • 没有索引和分区,但也能快速查询。
  • 利用数据级并行和指令级并行技术实现最佳性能。

数据操作

  • 支持原子操作,如SELECTINSERTDELETEUPDATEREPLACECOPYMERGE
  • 提供高级功能,如时间旅行和多目录(Apache Hive / Apache Iceberg)。
  • 支持以 CSV、JSON 和 Parquet 等各种格式。
  • 支持半结构化数据类型,如 ARRAY、MAP 和 JSON 。
  • 支持类似 Git 的 MVCC 存储,以便于查询、克隆和恢复历史数据。

对象存储

  • Amazon S3
  • Azure Blob Storage
  • Google Cloud Storage
  • MinIO
  • Ceph
  • Wasabi
  • SeaweedFS
  • Cloudflare R2
  • Tencent COS
  • Alibaba OSS
  • QingCloud QingStor

Databend 的高级架构由meta-service layerquery layerstorage layer组成。

meta-service layer(元服务层)有效地支持多个租户,该层在系统中发挥着至关重要的作用:

  • 元数据管理:处理数据库、表、集群、事务等的元数据。
  • 安全性:管理安全环境的用户身份验证和授权。

query layer(查询层)处理查询计算,由多个集群组成,每个集群包含多个节点。每个节点是查询层中的核心单元,由以下部分组成:

  • 规划师:使用来自的元素为SQL语句制定执行计划关系代数,结合了投影、滤波器和限位等运算符。
  • 优化器:基于规则的优化器应用预定义规则,如“谓词下推”和“未使用列的修剪”,以优化查询执行。
  • 处理器:遵循 Pull & Push 方法,根据规划师指令构建查询执行管道。处理器相互连接,形成一个可以分布在节点之间的管道,以提高性能。

storage layer采用开源柱状格式 Parquet ,并引入了自己的表格格式,以提高查询性能。主要功能包括:

  • 二级索引:加快各种分析维度的数据位置和访问速度。
  • 复杂数据类型索引:旨在加快半结构化数据等复杂类型的数据处理和分析。
  • :Databend 有效地将数据组织成段,提高数据管理和检索效率。
  • 集群:在段内使用用户定义的集群密钥来简化数据扫描。

安装和配置

Databend 官网:https://databend.rs/doc/integrations/access-tool/mysql

Databend 下载:https://databend.rs/download

本地部署,使用 JDBC 驱动程序连接 Databend 步骤如下:

  1. 根据官网下载地址,选择与自己电脑版本对应的,下载解压后可以看到以下系列文件。
    在这里插入图片描述

  2. 将文件 databend-query.toml 中的以下部分注释取消。
    在这里插入图片描述

  3. 在文件夹脚本中运行脚本**start.sh,打开进入该文件目录中终端执行 ./scripts/start.sh

  4. 在DBeaver中,选择数据库>驱动程序管理器以打开驱动程序管理器,然后单击新建以创建新驱动程序。

在这里插入图片描述
根据上图片,添加设置相关信息如下图:

在这里插入图片描述

  1. 在“”选项卡上,单击“添加工件”,然后将以下内容复制并粘贴到“**依赖项声明”**文本框中,点击确定即可。
<dependency><groupId>com.databend</groupId><artifactId>databend-jdbc</artifactId><version>0.0.8</version>
</dependency>

在这里插入图片描述

  1. 使用前面添加的驱动,连接本地的 Databend 。
    在这里插入图片描述

相关扩展

Databend支持的工具、平台和编程语言如下:

在这里插入图片描述

可以查看对应的工具和编程语言,了解更多用法。

参考资料

  • Databend 官网
  • Databend 下载
  • Docker和本地部署
  • 通过JDBC连接到Databend
  • Databend生态系统

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/324179.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C-数据类型的内存表示

目录 刷语法题 把字符串转换成整数 1时遇到数值溢出问题&#xff0c;借此机会回顾一下相关知识。 以下ChatGPT的回复&#xff1a; 数据类型的二进制表示是什么&#xff1f; 数据类型的二进制表示是指如何在计算机内存中用二进制&#xff08;即由 0 和 1 组成&#xff09;的形式…

XMLHttpRequest

目录 创建 XMLHttpRequest 对象配置请求设置请求头发送请求处理响应取消请求loadend XMLHttpRequest 是一个 JavaScript API&#xff0c;它提供了一种在客户端与服务器进行数据交换的方式&#xff0c;可以在不刷新页面的情况下异步更新部分网页内容。虽然现代开发中越来越多地使…

深入浅出XTTS:Oracle数据库迁移升级利器

演讲大纲&#xff1a; 1. 什么是XTTS 2. 适用场景 3. XTTS的基本操作步骤 4. XTTS案例分享 今天主要跟大家分享一下XTTS,在网上曾看过相关讨论,但发现按网上讲的那些去实际操作的话,还是会遇到一些坑,并不能实际落下来,所以今天想跟大家分享一些实战干货. 一、什么是XTTS …

Redis偶发Cannot determine a partition for slot报错问题

Redis偶发Cannot determine a partition for slot报错问题 一、背景二、问题定位1、报错位置2、lettuce定时刷新任务3、本地缓存masterCache先清理后写入的问题 三、解决方案&#xff1a;版本升级 一、背景 线上系统&#xff08;springboot&#xff09;经常报错Cannot determi…

Linux内存管理:(六)页交换算法

文章说明&#xff1a; Linux内核版本&#xff1a;5.0 架构&#xff1a;ARM64 参考资料及图片来源&#xff1a;《奔跑吧Linux内核》 Linux 5.0内核源码注释仓库地址&#xff1a; zhangzihengya/LinuxSourceCode_v5.0_study (github.com) 1. 引言 在Linux操作系统中&#x…

6592A便携式高精度光伏电池伏安特性测试仪

6592A便携式高精度光伏 电池伏安特性测试仪 光伏仪器 主要用于室外太阳能电池阵列/组件/电池片伏安特性测试 国产思仪 01 产品综述 6592A便携式高精度光伏电池伏安特性测试仪&#xff0c;主要用于室外太阳能电池阵列/组件/电池片伏安特性测试&#xff0c;能够方便、快速的…

系列三十三、如何将一个springboot jar做成批处理文件

一、将一个springboot jar做成批处理文件 1.1、需求 最近在写【Spring Cloud Alibaba】的系列文章&#xff0c;其中有一个部分是安装Sentinel控制台&#xff0c;使用命令执行完全没有问题&#xff0c;但是命令太长了&#xff0c;每次启动时都要找笔记&#xff0c;然后粘贴到命…

小兔鲜儿 uniapp - 项目打包

目录 微信小程序端​ 核心步骤​ 步骤图示​ 条件编译​ 条件编译语法​ 打包为 H5 端​ 核心步骤​ 路由基础路径​ 打包为 APP 端​ 微信小程序端​ 把当前 uni-app 项目打包成微信小程序端&#xff0c;并发布上线。 核心步骤​ 运行打包命令 pnpm build:mp-weix…

C语言编译器(C语言编程软件)完全攻略(第十三部分:VS2010使用教程(使用VS2010编写C语言程序))

介绍常用C语言编译器的安装、配置和使用。 十三、VS2010使用教程&#xff08;使用VS2010编写C语言程序&#xff09; 提示&#xff1a;VS2010 可以在 XP、Win7 和 Win8 下完美运行&#xff0c;但在 Win10 下可能会有兼容性问题&#xff0c;使用 Win10 的读者建议安装 VS2015 或…

四种“栈溢出检测方法”实现分析(2种纯软件、一种纯硬件、一种软硬件结合)

1、两种纯软件的栈溢出检测方法 参考博客&#xff1a;《freeRTOS的栈溢出检测机制》&#xff1b; 2、纯硬件&#xff1a;使用栈限制寄存器 2.1、工作逻辑分析 前提条件&#xff1a;使用满减栈硬件上提供栈限制寄存器&#xff08;用SP_limit表示&#xff09;&#xff0c;可以…

HttpRunner自动化测试之实现参数化传递

参数化实现及重复执行 参数化测试&#xff1a;在接口测试中&#xff0c;为了实现不同组数据对同一个功能模块进行测试&#xff0c;需要准备多组测试数据对模块进行测试的过程。 在httprunner中可以通过如下方式实现参数化&#xff1a; 1、在YAML/JSON 中直接指定参数列表 2、…

2024年5大海外代理IP测评推荐

在跨境电商行业&#xff0c;想要发送安全运营跨境电商账号&#xff0c;多账号社媒推广&#xff0c;独立站SEO优化等等的业务都少不了代理IP工具。安全高质的代理IP可以保障你的网络活动安全、匿名、高效。 面对众多代理IP商&#xff0c;您是否很难做出购买决定&#xff1f;哪些…