Databend 开源周报第 140 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持 EXECUTE IMMEDIATE

Databend 现已支持 EXECUTE IMMEDIATE 命令,此命令允许用户在单个语句中执行复杂的 SQL 逻辑,提供更为灵活的 SQL 处理能力。

示例如下:

EXECUTE IMMEDIATE $$
BEGINLET x := 1;LET y := x + 1;LET z RESULTSET := SELECT :y + 1;RETURN TABLE(z);
END;
$$;
----
┌───────┐
│ 2 + 1 │
│ UInt8 │
├───────┤
│     3 │
└───────┘

此特性使 Databend 能够更好地支持复杂的数据处理场景。并进一步推进了我们在支持存储过程和 SQL 脚本方面的工作。也欢迎感兴趣的小伙伴一起参与相关功能的开发迭代。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

  • PR #15144 | feat: add EXECUTE IMMEDIATE statement 
  • Issue #14904 | Feature: Stored procedure and SQL Scripting

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

技术:Towards Efficient Distributed Group Aggregation

在大规模数据分析(OLAP)中,分组聚合(Group Aggregation)是一项广泛应用的技术。与常规的 SELECT 查询不同,分组聚合会对数据集按照组划分并对组数据进行聚合,从而改变结果基数。

受到 DuckDB 博客的启发,Databend 开发了一种新型的聚合哈希表来优化分组聚合的处理效率。此外,为了更好地适应分布式场景,Databend 也设计并实现了一系列针对分布式的优化。 

Blog | Towards Efficient Distributed Group Aggregation

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持 ST_GEOMPOINTFROMGEOHASH 和 ST_MAKEPOLYGON 地理信息函数。
  • 支持变更表注释。
  • 为时间旅行支持偏移量。
  • 阅读文档 Docs | Full-Text Index 了解 Databend 全文索引能力。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

在查询日志中增加查询摘要

查询摘要是对查询的总结,如果两个查询的摘要相同,这意味着它们共享相同的模式。例如,以下两个查询摘要是相同的:

"SELECT id FROM t1 WHERE name = 'a';"
"SELECT id FROM t1 WHERE name = 'b';"

通过检查各自的查询摘要,可以确定哪种查询模式耗时更多,有助于优化数据库性能和资源利用。

Issue #15164 | feat: add query digest to query_log

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 GitHub service · Issue #4253 · apache/opendal · GitHub 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:Releases · datafuselabs/databend · GitHub

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • Databend Website
  • GitHub Discussions
  • Twitter
  • Slack Channel

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/623544.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

项目7-音乐播放器2(上传音乐+查询音乐+拦截器)

0.加入拦截器 之后就不用对用户是否登录进行判断了 0.1 定义拦截器 0.2 注册拦截器 生效 1.上传音乐的接口设计 请求: { post, /music/upload {singer,MultipartFile file}, } 响应: { "status": 0, "message&…

访问者模式【行为模式C++】

1.概述 访问者模式是一种行为设计模式, 它能将算法与其所作用的对象隔离开来。 访问者模式主要解决的是数据与算法的耦合问题,尤其是在数据结构比较稳定,而算法多变的情况下。为了不污染数据本身,访问者会将多种算法独立归档&…

选择、插入、冒泡、计数、堆、归并、快速排序算法的Java代码汇总和GUI界面时间测试与讲解

运行效果: Video_2024-04-16_150519 文章目录 前言:排序算法在数据结构和算法中的重要性一、排序算法详解1.选择排序2.插入排序3.冒泡排序4.计数排序5.堆排序6.归并排序7.快速排序 二、实现一个可以计算时间的Java GUI排序应用程序 前言:排序…

【Linux】进程间通信——system V版本 共享内存

目录 共享内存 原理 实践 shmget() 创建共享内存 shmctl() 删除共享内存 shmat() 挂接进程和共享内存 shmt() 进程和共享内存去关联 共享内存的特性 优势 劣势 用共享内存实现进程间通信 共享内存 原理 两个进程的PCB各自维护着一个进程地址空间。当两个进…

ViM-UNet:用于生物医学细分的 Vision Mamba

ViM-UNet:用于生物医学细分的 Vision Mamba 摘要IntroductionMethod and Experiments结果与讨论 ViM-UNet: Vision Mamba for Biomedical Segmentation 摘要 卷积神经网络(CNNs),尤其是UNet,是生物医学分割的默认架构…

Linux安装部署Tomcat

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ Linux安装部署Tomcat //将tomcat压缩包解压到对…

Innodb之redo日志

Innodb引擎执行流程 redo log ​ MySQL中的redo log(重做日志)是实现WAL(预写式日志)技术的关键组件,用于确保事务的持久性和数据库的crash-safe能力。借用《孔乙己》中酒店掌柜使用粉板记录赊账的故事,…

小程序视频下载器

下载高手,让小程序视频下载变得前所未有的简单!专为非编程专业人士设计,该工具免去了繁琐的抓包软件学习过程,无需深入研究Fiddler或Charles的配置。它优化了视频、图片和音频资源的下载,提供直观的操作界面&#xff0…

拉普拉斯金字塔的频谱分析

1. 基本分析 拉普拉斯金字塔分解,主要由以下步骤组成: 对输入图像 L0 进行低通滤波,其中常采用高斯滤波;对低通滤波后的图像进行 1/2 倍率的下采样,这里的下采样通常是指直接取偶行且偶列(以 0 开始计&am…

创建影子用户

文章目录 1.认识影子用户2.创建隐藏账户并加入管理员组3.修改注册表3.删除用户4.添加管理员权限 1.认识影子用户 影子用户通常指的是那些在系统用户列表中不可见,但在某些情况下可以进行操作的用户。在内网渗透过程中,当我们拿到shell时,肯定…

微博百度热搜收集

背景 大家都有使用微博、百度吧,而每天的热搜想必大家也用的不少。微博、百度的热搜有7、8种分类,每个单独查看比较耗费时间,效率极低,大概要花费3,4分钟左右。最近闲来无事,冒出个想法,是不是有…

rmallox勒索病毒#如何防范及处理?

rmallox勒索病毒介绍 rmallox将其特定的“.rmallox”扩展名添加到每个文件的名称中。例如,您命名为“my_dog.jpeg”的照片将被转换为“ my_dog.jpeg.rmallox”,在名为“ 资料.xlsx ”的Excel表格中报告——转换为“ 资料.xlsx.rmallox”,等等…