随着大数据时代的到来,数据资源的治理成为企业面临的重要挑战。快手作为一家领先的短视频平台,其大数据成本治理体系及实践具有重要的参考价值。本文将从第三方角度,对快手的大数据成本治理策略和实践进行深入解析。
一、大数据资源治理的必要性
快手面临的主要问题包括任务运行慢、存储资源增长过快、新增任务资源不足等。这些问题不仅影响了数据处理效率,也增加了成本风险。因此,大数据资源治理成为快手的必然选择。
二、治理策略的公式化拆解
快手通过公式化拆解治理策略,将计算总资源分解为调度频次、任务数、申请计算资源数、运行时长和优先级等多个因素。这种策略有助于更精确地控制资源和成本,提高资源利用率。
三、大数据引擎的持续优化
快手对大数据引擎进行了持续的优化,包括HBO离线计算、HBO实时计算、JVM升级、Spark Blaze等。这些优化措施显著提高了数据处理效率和性能。
四、数仓效率和治理优化
快手通过数仓模型效率评估和冗余计算治理,提高了数仓的整体效率。例如,通过相似度计算优化数仓模型,减少冗余计算和存储,提高了数据分析和报告的生成速度。
五、资产和业务领域价值ROI
快手通过资产价值评级得分和资产成本得分,计算资产ROI。这种评估方法有助于识别更有价值的数据资产,从而提高数据资产的管理效率。
六、产品工具的治理支撑
快手开发了资源治理工具(观象台),集问题诊断、问题发现、问题治理、治理收益、自动治理于一体。这个平台为数据开发提供了强大的治理支撑。
七、未来规划
快手计划根据技术、业务、数仓元数据建设资产的画像体系,探索数仓链路级别的治理,建设资产价值视图等。这些规划将进一步提高大数据成本治理的效率和效果。
总结,快手的大数据成本治理体系及实践为其他企业提供了宝贵的参考。通过公式化拆解治理策略、优化大数据引擎、提高数仓效率、计算资产ROI、开发治理工具等手段,快手成功地提高了数据资源的利用率和效率。这些实践对于其他企业在大数据时代中实现成本控制和业务增长具有重要的借鉴意义。