成本减半 + 效率翻倍:这家企业用 11 天实现数据处理飞跃

news/2025/2/23 0:55:54/文章来源:https://www.cnblogs.com/bytedata/p/18545623

伴随着云计算和数字化浪潮的推进,越来越多行业数据实时性的权重正在被加速提升,对企业而言,如果想要保证业务的持续发展,其底层数据库必须要能满足数据的实时性和高并发要求。

除此之外,在降本增效的大潮下,“高性价比”也成为企业选择一款数仓的重要因素。

那么,企业应该如何构建自己的实时数仓体系,并兼具性能、成本、运维等全部需求?

让我们把视线聚焦到数字广告行业,这家企业仅仅用了 11 天,在数据处理方面,就实现了效率提升 40%、成本降低 30%。这就是数字化广告平台——布鲁肯。

业务背景:实时数仓是广告业数据引擎的核心动力

作为一家数字化广告平台,布鲁肯覆盖全渠道自助式变现解决方案,为移动开发者提供增长和变现一体化的商业解决方案。一方面,布鲁肯帮助媒体端(如电商平台、社媒网站等)获得更大的流量和广告收益,另一方面帮助广告主提供足够精准的广告投放策略,以提高产品曝光。

以 APP 开屏广告展示为例,开屏广告展现在人们眼中的时间仅需 200ms,甚至是 100ms。在如此短时间内,上演的却是一个完整周期的广告模型——从打开时的接受用户数据,到基于用户数据生成对应的广告策略,最终再反馈到产品端进行前端展示。

而为这个复杂精密的实时数字广告模型提供核心动力的,是布鲁肯的底层实时数据仓库,在特定节日大促期间如 618、双 11 等,底层的数据流转则更是会被以十倍、乃至百倍的要求提速。

业务痛点:无法平衡的效率与成本

布鲁肯在全球拥有 600 多家 DSP、代理平台和广告主伙伴,底层数据系统一天的请求次数高达 150 亿,数据流量超过 2GB/s,广告日均点击 20M+,多样化场景、海量数据高并发的需求场景每时每刻都在布鲁肯上演。

数据体量大,场景多样,导致整体数据架构复杂的,之前布鲁肯基于开源 ClickHouse 自建系统,其本身固有的列式存储模式,伴着业务发展,对应的硬件成本更在飞速飙升。另外, ClickHouse 本身虽然具备强大的分析和线性拓展能力,但在复杂查询等层面不擅长。

布鲁肯在构建实时数仓过程中主要面临问题:

  • 海量数据下的高并发:采集数据量大 ,数据流量超过 2GB/s,并发处理要求高。

  • 系统稳定性要求:业务包含广告营销投流分析等,对于数据质量与稳定性要求高。

  • 弹性扩容和降本增效:资源需求随营销活动动态变化,比如 618、双 11 等大促期间,数据量级骤增,性能要求更高,需要能根据实际业务需求,灵活调整资源配置。

直观反映到企业经营层面:底层硬件以及数据库运维侧不断在投入更多的企业运营成本,但前端业务依然会出现“卡顿、用户请求反馈慢、投放策略优化不及时”等问题。

优化方案:从 ClickHouse 到 ByteHouse 实时数仓解决方案

  1. 选型历程:

关于数据库的选型工作在布鲁肯内部持续开展,调研产品包括 Flink 等国内诸多主流数据库产品,在相关业务场景的性能表现以及使用成本,未能满足要求。

从最开始选择 ByteHouse 到使用其进行生产,布鲁肯仅仅用了 11 天。引入 ByteHouse,对布鲁肯企业业务影响极小且成本极低。

  1. 产品组合:

云原生数据仓库 ByteHouse (企业版)+Kafka

  • Kafka 集群:用于流式数据的传输和处理,确保大规模数据在不同系统之间的高效传输和实时处理。

  • ByteHouse 集群: 作为核心的数据存储与处理平台,支持大规模数据的存储、查询和分析,支持高效处理实时数据和批量数据,提供快速的查询响应和复杂的分析能力。

  1. 方案介绍:

基于 ByteHouse+Kafka 搭建一套高效、可靠、可扩展的实时数仓链路,解决数据整合、实时处理、广告效果评估等问题,提升广告业务的整体运营效率,更好地为下游合作伙伴广告投放决策提供支持。

  • 数据链路设计:来源于广告终端的数据,进入 Kafka 集群,再经过 ByteHouse 内表和物化视图加工,同步到数据应用中,最终辅助广告主、广告平台等进行投放效果的评估、费用结算等。

  • 生态兼容性:ByteHouse 与 Kafka 具备很强适配性,为了更好地适配 Kafka,ByteHouse 内置增强型 Kafka 引擎,为数据写入提供高性能保障。

  • 扩展性:ByteHouse+Kafka 均为分布式架构优势,让布鲁肯系统具备充分的灵活性,可以在分钟级别下完成全链路扩容,以便应对广告场景中常见的大促等流量峰高。

  • 压缩成本:ByteHouse 具备冷存储的能力,将热数据自动转存到冷存储的方式引入布鲁肯,有效缓解业务存储空间持续增长的问题。

  1. 应用场景

以今年 618 大促为例。数字广告行业与电商等行业具备同样流量峰值点,底层服务器和数据库需要紧急扩容和定向监测运维来应对流量高峰。

ByteHouse 与布鲁肯提前 2 周联合制定预案,包括如何扩容、紧急处理等。在 618 大促期间,运维人员只需要点击扩容按键等简单操作,就能实现分钟级扩容。如果基于之前的开源产品,这类运维工作投入成本和工作量会是现在的几十乃至上百倍。

最终成效:1 个人力,降低企业 30%成本

  1. 扩展业务边界

“以 618 为例,我们之前只上了程序化竞价广告,像今年,我们包括其他的一些网站、社媒,以及品牌 PDB 投放我们也都可以支持,相当于业务宽度更广了。”

——布鲁肯市场负责人张亚灵

  1. 极致降本增效

“基本全线切到火山引擎之后,我们的成本大概降低了 30%,在效率侧,我们评估提高了 30%- 40% 左右,这两个一叠加,其实我觉得效率整体提高一半是有的。”

  ——布鲁肯市场负责人张亚灵

“其实在整个过程中,我们几乎没有提供过重的服务,除了部分参数和指标的调整确认,也就是一个研发接近 20%、30%的人力投入,对于布鲁肯来说,只投入 1 个人力就完成了接入和运维。”

——ByteHouse 团队相关负责人

现阶段,布鲁肯的同款聚焦于降本增效的实时数仓解决方案已经上线。

 

  案例来源:产业家《实时数仓,站上产业潮头》

 

《ByteHouse 极致降本指南》也重磅上线,欢迎领取:https://wj.toutiao.com/q/324727/m770OOv3/ec1a/#/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/833347.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows激活神器HEU KMS Activator v42.3.1

软件介绍 HEU KMS Activator,简洁高效的全能KMS/OEM激活工具,适用所有Windows, Office版本,无需联网即可一键激活,支持UEFI的KMS激活工具。KMS服务是微软对Windows, Office等产品的批量许可服务,利用KMS可以激活局域网内的产品。该工具利用KMS机制在系统搭建KMS服务器,从…

如何远程实时监控员工的电脑屏幕?60教会你,五个妙招轻松搞定!

https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9073269535369745774%22%7D&n_type=1&p_from=4 使用远程桌面协议(RDP)远程桌面协议(RDP)是一种允许用户远程连接到另一台计算机的技术。通过配置RDP,管理员可以实时访问员工的…

终端ssh终端模拟软件:Termius激活安装包

Termius是一款功能强大的跨平台终端管理工具,提供了友好的用户界面,支持SSH、Telnet、SFTP等多种连接协议,方便用户远程连接和管理服务器。此外,Termius还支持多平台同步、文件传输、批量操作、脚本自动化等进阶功能,且具备强大的数据加密和安全性保障。无论是开发人员、系…

解读Karmada多云容器编排技术,加速分布式云原生应用升级

Karmada提供了一个全局的控制面板,使得用户能够像操作单一集群一样管理多云上的Kubernetes集群。本文分享自来源:《华为云DTSE》第五期开源专刊,作者:任洪彩 华为云高级软件工程师,Karmada社区Maintainer。管理和协调跨多个云平台的容器化应用是当前企业面临的复杂性挑战之…

京东零售广告创意:基于人类反馈的可信赖图像生成

作者:京东零售 冯伟ECCV2024: Towards Reliable Advertising Image Generation Using Human Feedback 链接:https://arxiv.org/abs/2408.00418 摘要:在电商领域,吸引顾客注意力的广告图片至关重要。尽管生成模型可以自动生成图像,但它们往往会产生不符合广告标准的图片,可…

如何分发APP供用户使用?

​在移动互联网时代,APP(应用程序)已成为人们日常生活中不可或缺的一部分。无论是购物、社交、娱乐还是工作,APP都提供了极大的便利。然而,开发一款APP只是第一步,如何将其有效地分发到用户手中,让用户能够轻松下载并使用,才是决定APP成功与否的关键。 一、应用商店分发…

当然不是草台班子-冲刺计划

作业所属课程 软件工程2024作业要求 2024秋软工实践团队作业-第三次( Alpha冲刺)作业目标 做出alpha冲刺的计划团队名称 当然不是草台班子团队成员学号 姓名102201427 侯丽珂102201426 郑嘉祺102201241 戴康怡102201218 肖晗涵112200328 谢李东292300304 陈鹭102201242 魏儀阳…

设备管理系统功能拆解——设备档案管理

设备档案管理是设备管理系统中的一个核心组成部分,简单来说,它就是对设备的所有信息进行系统化的记录与管理,包括设备的基本数据、使用情况以及维护历史等。 如果一个工厂里数十台设备同时运转,没有准确的设备档案—— 设备出现故障时,管理者如何能迅速找到相关信息? 当需…

jenkins环境搭建

linux安装maven及环境配置 一、maven下载地址,安装binaries版本 https://dlcdn.apache.org/maven/maven-3/3.8.8/ 或者使用wget命令命令:wget https://https://dlcdn.apache.org/maven/maven-3/3.8.8/binaries/apache-maven-3.8.8-src.tar.gz二、解压命令:tar -zxvf apache-…

快速上手 KSQL:轻松与数据库交互的利器

上次我们通过 Docker 安装了 KingbaseES 数据库,今天我们将开始学习并快速上手使用 KSQL。简单来说,KSQL 本质上是一个客户端工具,用于与数据库进行交互。启动后,我们可以像使用普通的 SQL 一样执行查询和操作,这将是一个很好的练习机会。 同时,我们也可以借此机会探索 K…

数字能量的职场释放:实物量法诠释效率的多维度

在数字时代,职场对效率的要求不再单纯体现在“加快节奏”或“完成任务”上,更需要具备一种深度理解和动态管理的能力。我们常听到“全局观”“统筹管理”等术语,但如何实现这一点?如何在多维度的职场场景中释放效率,实现自我与团队的数字化能量? 这里引入一个概念——“实…

无聊的我啊~~~~~

本文来自博客园,作者:一石数字欠我15w!!!,转载请注明原文链接:https://www.cnblogs.com/52-qq/p/18545476