Databend 开源周报第 118 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

MERGE INTO 现已支持分布式执行

MERGE INTO 语句会根据指定的条件和匹配标准,使用来自指定源的数据,在目标表中执行对行的插入、更新或删除操作。

现在 Databend 中的 MERGE INTO 已经支持分布式执行,这将会带来更高效的数据集成能力,其物理计划如下图所示:

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

  • PR #13151 | feat: support distributed merge_into

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

使用 LakeFS 将数据版本化嵌入你的分析工作流

lakeFS 致力于为共享和协作处理数据提供解决方案,用类似 Git 的操作逻辑赋能对象存储,采用版本化方案为数据提供逻辑一致的视图,为现代化数据工作流嵌入有意义的分支名和提交信息,并且为数据、文档的一体化提供解决方案。

Databend 在提供分布式、弹性可拓展、运维方便的高性能查询引擎,同样支持类似Git的多版本存储,可以轻松查询、克隆和还原任意时间点的数据。

结合 LakeFS 的数据版本化能力和 Databend 的类 Git 数据管理能力,可以确保数据完备性,并且为数据分析工作流提供高效、高可用的一致视图。

如果您想了解更多信息,请查看下面列出的资源。

  • Blog | Incorporate Data Version Control into Your Analytics Workflow

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持 JSON 运算符:??| 和 ?& 。
  • 支持对 STAGE 和 UDF 的权限管理。
  • 支持 flatten 表函数。
  • 支持使用 URL 创建外部表:CREATE STAGE test_stage [URL =] 's3://load/files/' 。
  • 阅读文档 Example 2: Attaching Table in READ_ONLY Mode 了解如何使用 ATTACH TABLE 的只读模式。
  • 阅读文档 Conversion Functions 了解 Databend 中的类型转换函数与规则。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持读取 Delta 表格式

Databend 目前支持通过 Catalog 挂载并读取 Iceberg 表格式中的数据,计划支持的下一个目标是 Delta Lake 。

Delta Lake 是由 Databricks 发起并开源的存储格式。它通过基于文件的事务日志扩展了 Parquet 数据文件,使其能够处理 ACID 事务和可扩展的元数据。 Delta Lake 完全兼容 Apache Spark API,并且其设计与结构化流式处理紧密集成,使您可以轻松地在批处理和流式处理操作中使用单个数据副本,并提供大规模增量处理。

Issue #13429 | add read only support for Delta table 

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

  • @guojidan 为 SHOW 语句支持了更多过滤选项,#13510 。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:https://github.com/datafuselabs/databend/releases

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • Databend Website
  • GitHub Discussions
  • Twitter
  • Slack Channel

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/164384.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电脑发热发烫,具体硬件温度达到多少度才算异常?

环境: 联想E14 问题描述: 电脑发热发烫,具体硬件温度达到多少度才算异常? 解决方案: 电脑硬件的温度正常范围会因设备类型和使用的具体硬件而有所不同。一般来说,以下是各种硬件的正常温度范围: CPU:正…

安装node-sass安装失败(Failed at the node-sass@4.14.1 postinstall script.)

npm i安装依赖,安装node-sass失败 全局设置淘宝镜像,还是下载不下来。下载不下来可能是因为默认从github上去下载node-sass,而国内经常连不上或者网络不好。可以单独下载 npm i node-sass4.14.1 --sass_binary_sitehttps://npm.taobao.org/…

TensorFlow学习笔记--(1)张量的随机生成

张量的生成 如何判断一个张量的维数:看张量的中括号有几层 0 1 2 :零维数列 [2 4 6] : 一维向量 [ [1 2 3] [4 5 6] ] : 二维数组 两行三列 第一行数据为 1 2 3 第二行数据为 4 5 6 以此类推 n维张量有n层中括号 tf.zeros(%指定一个张量的维数%) 生成一…

易点易动设备管理系统:提升设备巡检和维修效率,延长设备使用寿命的利器

在现代企业中,设备管理是一个至关重要的环节。然而,许多企业在设备巡检和维修方面面临挑战,如效率低下、信息不透明等问题。为了帮助企业提升设备巡检和维修效率,并延长设备的使用寿命,易点易动设备管理系统应运而生。…

卷积神经网络中 6 种经典卷积操作

深度学习的模型大致可以分为两类,一类是卷积神经网络,另外一类循环神经网络,在计算机视觉领域应用最多的就是卷积神经网络(CNN)。CNN在图像分类、对象检测、语义分割等经典的视觉任务中表现出色,因此也早就…

腾讯云16核服务器配置有哪些?CPU型号处理器主频性能

腾讯云16核服务器配置大全,CVM云服务器可选择标准型S6、标准型SA3、计算型C6或标准型S5等,目前标准型S5云服务器有优惠活动,性价比高,计算型C6云服务器16核性能更高,轻量16核32G28M带宽优惠价3468元15个月,…

干洗店洗鞋店管理系统app小程序;

干洗店洗鞋店管理系统是一款专业的洗衣店管理软件,集成了前台收费收银系统、会员卡管理系统和财务报表系统等强大功能。界面简洁优美,操作直观简单。这款系统为干洗店和洗衣店提供了成本分析、利润分析、洗衣流程管理等诸多实用功能,用全新的…

OPCUA 行业配套标准:机器人

OPC UA 定义了对象,对象类型,结构化组织能力和定义对象之间关系的能力,利用这些基础和衍生类型及对象,用户还可以搭建出更复杂的类型,关系和对象。 如果不同的厂商或者用户定义的信息模型不同,将会影响系统…

【Vue】组件封装小技巧 — 利用$attrs和v-bind接收传递未定义的属性

使用介绍 在Vue.js中,$attrs 和v-bind可以用于组件的二次封装,以在封装的组件中传递父组件的属性和事件。这对于创建高度可定制的通用组件非常有用。 下面是一些示例代码: 假设你有一个名为MyButton的自定义按钮组件,它接受一些…

CCF ChinaSoft 2023 论坛巡礼 | NASAC青年软件创新奖论坛

2023年CCF中国软件大会(CCF ChinaSoft 2023)由CCF主办,CCF系统软件专委会、形式化方法专委会、软件工程专委会以及复旦大学联合承办,将于2023年12月1-3日在上海国际会议中心举行。 本次大会主题是“智能化软件创新推动数字经济与社…

公司文件怎么加密

在当今数字化时代,保护企业文件的安全性变得尤为重要。文件加密是一种有效的安全措施,可以防止未经授权的访问和数据泄露。本文将介绍企业文件加密的重要性,并特别推荐金稻壳安全狗作为可靠的加密软件。 企业文件加密的重要性 企业文件包含了…

ICCV 2023|PViC:构建交互谓词视觉上下文,高效提升HOI Transformer检测性能

文章链接:https://arxiv.org/abs/2308.06202 代码仓库:https://github.com/fredzzhang/pvic 在今年的计算机视觉顶会上,基于视觉Transformer(ViT)的工作仍然占有非常重要的地位。目前最受研究者青睐的,莫过…