StarRocks--被 Databricks CEO 提及的数据库

Databricks 介绍

Databricks是一家美国的大数据独角兽公司,由 Apache Spark 的创建者所创立。Databricks 开源了 Delta Lake--基于 Apache Spark 的下一代数据湖存储引擎。Delta Lake 是目前市面上主流的数据湖存储引擎之一,与 Apache Hudi 和 Apache Iceberg 并称为数据湖三剑客。

在最近结束的 Databricks Data + AI Summit 上,Databricks CEO Ali Ghodsi 发布了 Delta Lake 3.0。这个新版本引入了一种名为通用格式(UniForm)的开放表格式,可读写三种流行的数据表格式,包括 Delta Lake、Apache Iceberg 和 Apache Hudi。这体现了 Databricks 拥抱开放数据生态的决心。

开放表格式通过提供一个标准和统一的方式来访问大数据集,而表格式的一统可以帮助用户降低多种格式共存的技术成本。可以说,这个理念与 StarRocks 期望构建的基于开放生态的,极速统一的湖仓分析新范式不谋而合!

​Ali Ghodsi 在主题演讲中提及了 StarRocks


StarRocks--极速统一的湖仓新范式

01 StarRocks 的极致查询性能

  • MPP 分布式执行

  • Pipeline 并行执行框架

  • 向量化执行引擎

  • CBO 优化器

  • Global Runtime Filter

  • Metadata Cache

  • Local Data Cache

  • Materialized View

关于 StarRocks 的极致性能已经有很多资料介绍了,这里就不多加展开。大家可以通过文末文章链接了解更多细节。

02 利用StarRocks的 "House" 能力进一步提升性能

StarRocks 不仅仅是一个查询引擎,同时也拥有一个强大的存储引擎,如果你希望进一步提升查询性能或者查询并发能力,你可以将数据导入到 StarRocks 中,StarRocks 的本地存储拥有丰富的索引能力、实时更新能力和多表 colocate join 能力。

数据导入 StarRocks 中有两种方式:手动导入数据和 MV 自动导入数据。

StarRocks 支持对数据湖上的表创建物化视图,并且支持自动数据同步和自动查询改写。

03 StarRocks 支持冷热分离+自动查询改写

大多数情况下,我们希望最近一周或者一个月的热数据拥有更好的查询性能,在 StarRocks 中,MV (物化视图)可以方便且高效地实现这一目标:

如上图所示,StarRocks 的 MV 可以只保存最近一个月的数据,当你查询 Data Lake 上的数据时,StarRocks 会帮你自动改写,最新的数据从 StarRocks 查询,而历史数据则从 Data Lake 查询,然后自动进行 Union 操作,将两部分数据合并返回给你。

04 StarRocks 支持实时更新

​因为 StarRocks 同时支持实时高效更新和写出到 Iceberg,所以我们可以基于 StarRocks 构建实时更新的 Lakehouse。当你同时需要实时更新、极致查询性能和开放的 Table Format,StarRocks 便是你的唯一选择。

05 简单易用的 Catalog 元数据管理

StarRocks 提供了一键同步外部数据库中的所有表元数据的功能,并且可以快速同步各种 Data Lake 数据源。

06 可弹性伸缩

StarRocks 用于数据湖分析的计算节点是无状态的,可以结合 K8s 进行快速弹性伸缩。

​在前面的内容中,我们总结了 StarRocks 数据湖的卓越能力。而在未来,我们的承诺依然是让数据处理变得更简单(统一)、更快速有效(极速)。我们期待进一步利用 Delta UniForm 的能力,使用户能够更轻松地在各种开放数据格式上进行亚秒级分析。这种生态上的融合能够将亚秒级分析的功能范围扩展到更广泛的用户群体,使数据分析比以往任何时候都更加容易!

想要再深入了解更多关于 StarRocks 湖仓分析的特性吗?欢迎利用以下资源:

当打造一款极速湖分析产品时,我们在想些什么

StarRocks 3.0 极速统一的湖仓新范式

技术内幕 | StarRocks 支持 Apache Hudi 原理解析

StarRocks 湖仓融合的四种范式

💬 加入 StarRocks 的 Lakehouse 用户小组,开启你与 StarRocks 的极速湖仓分析之旅! 点击链接填写完问卷后即可获得入群方式:https://tl-tx.dustess.com/0kGIuI4VTZ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/13737.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL入门必备:Linux中部署MySQL环境的四种方式详解

目录 一、仓库安装 二、本地安装 三、Docker中安装 四、源码安装 一、仓库安装 首先需要下载mysql软件包: 1、进入MySQL官网 2、进入MySQL社区版下载 3、使用yum方式下载MySQL 4、下载对应版本的软件包 5、这里可以不登录直接下载软件包 6、复制下载链接 7、然…

122.将实战网页部署到Netlify

● 本章我们将网站部署到Netlify ● 首先先点击右上角注册一个账号 ● 注册完成之后,点击sites,将我们的网站文件夹拖入 ● 上传成功 ● 之后就可以正常访问啦 ● 我们也可以修改我们的站点名称,让他更加好记

综合评价算法 | Matlab实现基于CRITIC法的综合评价算法

文章目录 效果一览文章概述研究内容源码设计参考资料效果一览 文章概述 综合评价算法 | Matlab实现基于CRITIC法的综合评价算法 研究内容 CRITIC法是一种比熵权法和标准离差法更好的客观赋权法。它是基于评价指标的对比强度和指标之间的冲突性来综合衡量指标的客观权重。考虑指…

Vue3使用echarts仪表盘(gauge)

Documentation - Apache ECharts 可自定义设置以下属性 仪表盘数据源(gaugeData),类型:Gauge[],必传,默认 []容器宽度(width),类型:number | string&#x…

web前端总结(一)HTML标签

1.语法结构&#xff1a; <标签 属性 “值”>内容</标签> <p align "center">标签内容</P> 2.标签 1.标题标签&#xff1a; **标题标签 <h1> - <h6>&#xff08;重要&#xff09;** 为了使网页更具有语义化&#xff0c;我们…

辅助性能优化——长安链性能分析工具原理及用法

如何提升区块链系统性能是很多开发者都会关注的事&#xff0c;但是有些对区块链并非十分熟悉的开发者可能会感到没有头绪。长安链提供了性能分析工具帮助开发者梳理系统耗时&#xff0c;优化系统性能。下面对长安链性能分析工具原理及使用进行介绍。 一、 概述 time_counter.s…

从视频源头到边缘智能:实现端到端AI解决方案的技术挑战与实践

从视频源头到边缘智能&#xff1a;实现端到端AI解决方案的技术挑战与实践 引言端到端AI解决方案打通视频源头采集视频传输和存储边缘计算和盒子设备 SDK示列 引言 随着人工智能技术的快速发展&#xff0c;端到端AI解决方案在各个领域的应用越来越广泛。这些解决方案能够实现从…

DAY41:贪心算法(十)监控二叉树

文章目录 968.监控二叉树思路遍历顺序空节点处理情况列举 最开始的写法debug测试&#xff1a;travelsal的输出多了1 修改版二叉树注意点时间复杂度总结 968.监控二叉树 给定一个二叉树&#xff0c;我们在树的节点上安装摄像头。 节点上的每个摄影头都可以监视其父对象、自身及…

Spark学习(二)---Spark运行架构和核心概念

1.Spark运行架构 Spark框架的核心是一个计算引擎&#xff0c;它采用了master-slave的结构。 图形中的 Driver 表示 master&#xff0c; 负责管理整个集群中的作业任务调度。图形中的 Executor 则是 slave&#xff0c;负责实际执行任务。 1.1 核心组件 由此可以得出&#xf…

在原有J-IM基础上改造,开发记录方便日后学习,主要区别加入mysql持久化,但是不完善、仅供参考

在原有J-IM基础上改造&#xff0c;开发记录方便日后学习&#xff0c;主要区别加入mysql持久化&#xff0c;但是不完善、仅供参考 原站地址 https://gitee.com/xchao/j-im 改造后的地址 https://gitee.com/lbx_1397372495/jim-chat 本地启动测试 1&#xff0c;修改mysql 数…

Openlayers鹰眼OverviewMap自定义样式时鹰眼大小调整

Openlayers鹰眼OverviewMap自定义样式时可以根据关注区域的范围长宽比调整鹰眼控件的宽、高大小&#xff0c;让关注的区域始终全部在鹰眼中显示。 如鹰眼控件宽设置100px时 /*鹰眼控件中地图容器的样式*/ .ol-custom-overviewmap .ol-overviewmap-map{border:none;width: 100p…

计算机毕业论文选题推荐|软件工程|小程序系列选题

文章目录 导文题目导文 计算机毕业论文选题推荐|软件工程 (***语言)==使用其他任何编程语言 例如:基于(***语言)门窗账务管理系统的设计与实现 得到:基于JAVA门窗账务管理系统的设计与实现 基于vue门窗账务管理系统的设计与实现 等等 题目 基于微信小程序和深度学习的宠物…