智能运维,由你定义:SAE自定义日志与监控解决方案

作者:久氢、丛霄、章进

背景

SAE【1】(Serverless 应用引擎)是一个全托管、免运维、高弹性的通用 PaaS 平台,实现了微服务应用、定时任务的 Serverless 化。产品初衷是将底层 Kubernetes 复杂度予以屏蔽,降低用户理解成本和使用门槛。用户并不感知底层 Infra,只需聚焦于核心的业务逻辑开发,而应用生命周期管理,微服务管理,日志,监控等功能交由 SAE 完成。

SAE 的极简易用、自适应弹性等特性吸引了越来越多的用户。然而,随着用户对应用可观测性和运维能力的需求不断提升,许多客户提出了更高层次的需求:如何在不修改主应用代码的情况下,灵活扩展日志采集、监控指标收集等功能?为了满足这些需求,SAE 推出了全新的自定义日志与监控解决方案,通过引入 Sidecar 容器的技术,为用户提供更强大的运维能力。

用户需求驱动:场景痛点分析

在日常答疑和工单反馈中,我们发现许多用户明确表达了对以下场景的强诉求:

  • 日志自由采集

许多用户希望通过某种方式,将主应用容器的日志实时采集并发送到自建日志系统(如 Elasticsearch 或 Loki),以实现日志的集中管理和分析。例如:使用 Filebeat 将日志数据采集发送到 Kafka 或其他日志存储平台。

  • 监控自定义指标收集

用户希望在不修改主应用代码的情况下,轻松采集主应用容器自定义性能指标和监控数据,并将其发送到监控平台(如 Prometheus )。

  • 资源隔离强诉求

部分用户在单个容器里运行多个进程,进程间的资源抢占问题引发服务受损。用户迫切需要一种机制来隔离不同进程的资源使用,确保核心业务不受干扰。

方案落地

为了让用户能够灵活扩展应用的功能,SAE 引入了 Sidecar 容器技术。允许用户在应用中添加一个或多个 Sidecar 容器,用于实现自定义日志采集、监控指标收集等功能。

在实现这一解决方案的过程中,我们也面临了一些挑战,并针对这些挑战提出了相应的应对策略。

应用多容器资源划分

在 Kubernetes 中,每个容器都可以设置资源请求(request)和资源限制(limit)。当没有 Sidecar 容器的时候主应用容器独享整个 Pod 资源,但在引入 Sidecar 容器后,如何合理划分资源成为一个关键问题。

我们为用户提供两种 Sidecar 资源划分模式,以满足不同场景的需求:

  1. 模式一:共享资源模式

    1. 配置方式:Sidecar 容器 request=0 && limit >0
    2. 特点:Sidecar 容器和主应用容器共享 Pod 的资源,但设置了 Sidecar 容器最大资源使用上限( limit>0 ),以防止 Sidecar 容器和业务主容器过度争抢资源,
    3. 适用场景:适用于资源敏感型用户,希望最大化利用资源的场景。
  2. 模式二:独立资源模式

    1. 配置方式:Sidecar 容器 request=limit
    2. 特点:Sidecar 容器独立占用指定的资源,不会与应用主容器发生资源争抢。例如,如果用户指定应用实例规格为 1c2g,而 Sidecar 容器的资源设置为 0.5c0.5g,则应用主容器可用资源为 0.5c1.5g。
    3. 适用场景:适用于对资源隔离要求较高的场景,确保 Sidecar 容器不会影响主应用容器的性能。

通过这两种模式,我们既满足了用户对资源灵活性的需求,也提供了足够的资源隔离保障。

应用运维复杂度降低

Sidecar 模式虽好,但它也增加了运维复杂度。为了让 Sidecar 容器既“好用”又“好管”,SAE 提供了一系列全链路的运维能力,覆盖 Sidecar 容器的生命周期管理。

Sidecar 容器运行状态

用户可以在控制台上清晰地查看 Sidecar 容器的状态变化,包括 Pending、Running、CrashLoopBackOff 等,方便实时观察 Sidecar 容器的健康状况。

Sidecar 容器日志

通过控制台,用户可以轻松查看 Sidecar 容器的日志,快速定位和排查问题。

Sidecar 容器 Webshell

用户可以通过控制台的 Webshell 功能直接登录到 Sidecar 容器,查看容器内的目录文件或执行命令,进一步提升问题排查效率。

Sidecar 容器监控

SAE 提供了 Sidecar 容器的 CPU 和内存监控指标,帮助用户更好地跟踪其资源消耗情况。(该功能目前处于灰度阶段)

Sidecar 事件通知

对于对 Sidecar 容器重启事件敏感的用户,SAE 提供了事件订阅功能。用户可以在事件中心【2】里订阅应用重启事件,并通过通知机制及时响应。

Sidecar 容器重启

SAE 实现了实例级别的容器重启能力,用户可以单独重启 Sidecar 容器,而无需重启整个 Pod。(该功能目前处于灰度阶段)
saectl 工具运维

为了进一步提升运维效率,SAE 提供了 saectl 工具【3】,允许用户与底层 Kubernetes 集群进行通信,实现对 Sidecar 容器的资源管理。对于熟悉 kubectl 的用户,推荐使用 saectl 工具来简化操作。

应用稳定性保障

Sidecar 容器作为主应用容器的辅助容器,虽然扩展了功能,但也带来了潜在的风险。为了确保整个应用的稳定性,我们采取了以下措施:

  1. 隔离性保障
    Sidecar 容器的运行状态失败不会影响主应用容器继续承接流量,确保核心业务不受干扰。
  2. 自动恢复机制
    当 Sidecar 容器出现异常时,SAE 会自动尝试重启容器,确保其尽快恢复正常运行。
  3. 资源限制
    通过设置 Sidecar 资源上限,避免 Sidecar 容器因资源争抢导致主应用容器性能下降。

案例:使用 SAE 优雅实现自定义日志采集

以下是一个典型的实战案例,展示用户如何通过 SAE 实现自定义日志采集功能。

场景描述

某些用户希望将 SAE 应用日志实时采集并发送到自建日志系统,以统一的方式进行日志分析和处理,用户自定义日志采集方案架构图如下所示:

操作实践

Sidecar 日志收集的核心原理是通过共享挂载卷实现应用主容器与 Sidecar 容器之间的日志传递。通过将应用主容器的日志路径挂出,用 Sidecar 容器访问路径下的日志来实现日志收集。实践这里只演示架构图中使用 Filebeat 采集日志数据输出到 Kafka 这一流程。

步骤1:创建 SAE 应用并添加 Sidecar 容器

在 SAE 控制台创建应用的时候,在「添加 Sidecar 容器」TAB 页可以点击添加 Sidecar 容器。

Sidecar 容器基础配置参数如下:

  • 自定义容器名称

为 Sidecar 容器指定一个易于识别的名称,如 filebeat。

  • 选择容器镜像

使用公网 filebeat 镜像,例如:swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/elastic/filebeat:8.15.3

  • 设置 Sidecar 容器资源上限

Sidecar 容器与主应用容器共享 CPU 和内存资源。为了确保主应用容器的正常运行,请合理设置Sidecar 容器的最大资源使用上限。

Sidecar 容器高级设置如下:

  • 设置启动命令

在启动命令区域为 Sidecar 容器设置启动命令:./filebeat -e -c filebeat.kafka.yml

  • 挂载 Sidecar 配置文件

在配置管理区域通过 ConfigMap 将 Sidecar 容器的配置文件挂载到容器的 /usr/share/filebeat/filebeat.kafka.yml 路径。以下是一个典型的 filebeat 采集日志到 Kafka 的配置文件内容示例:

filebeat.inputs:- type: logenabled: truepaths:- /var/log/*.log
output.kafka:hosts: ["kafka1:9092", "kafka2:9092", "kafka3:9092"]topic: "topic"partition.round_robin:reachable_only: truerequired_acks: 1compression: gzipmax_message_bytes: 1000000

注意:请根据实际需求调整日志路径、Kafka 地址和 topic 名称。

  • 配置共享存储卷

在共享临时存储区域,通过设置 emptyDir 并将其挂载到主应用容器和 Sidecar 容器中,实现日志的共享。例如将挂载路径设置为 /var/log ,来收集该路径下的应用日志。

步骤2:验证日志采集到 Kafka

登录 Kafka 实例控制台,可以看到 Sidecar 容器 filebeat 将主应用容器 /var/log 下的日志数据成功采集到 Kafka 指定的 Topic 中。

未来展望

通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。

最后,欢迎大家来使用 SAE,一款零代码改造、极简易用、自适应弹性的容器化应用全托管平台:“我们希望让用户做的更少而收获更多,通过 Serverless 化,深度用云就像用水电煤一样简单” 。

相关链接:

【1】SAE:

https://www.aliyun.com/product/sae

【2】事件中心:

https://help.aliyun.com/zh/sae/serverless-app-engine-upgrade/user-guide/event-center

【3】saectl 工具:

https://help.aliyun.com/zh/sae/serverless-app-engine-upgrade/developer-reference/saectl-tool/

点击此处,立即前往 SAE 主页查看详情!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/908907.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【THM】Alfred 阿尔弗雷德

【THM】 Alfred 阿尔弗雷德 Initial Access 初始访问在这个房间,我们将学习如何利用广泛使用的自动化服务器(Jenkins - 此工具用于创建持续集成/持续开发管道,允许开发者在对其代码进行更改后自动部署代码)上的常见配置错误。之后,我们将使用一种有趣的权限提升方法来获取…

从零开始编译安装Nginx:详细步骤与实战配置(附避坑指南)——基于CentOS 7的保姆级教程

一、为什么需要创建专用Nginx用户? 在Linux系统中,为服务创建独立的运行用户是安全最佳实践。Nginx默认以nobody用户运行,但通过创建专用用户nginx,可以限制其权限,防止潜在的安全漏洞影响系统其他部分。 操作步骤: # 创建不可登录的nginx用户(-M不创建家目录,-s指定不…

3.31 格林公式及其应用

1.1 类比 一元函数的积分可以通过两个边界的函数表示 二元函数的积分就可以通过曲线的积分表示1.2 例题例题2(不完全封闭的写法

ArkTs的@Watch状态监听

@Watch装饰器:监听并捕捉变量变化@Watch用于监听状态变量的变化,当状态变量变化时,@Watch的回调方法将被调用。@Watch在ArkUI框架内部判断数值有无更新使用的是严格相等(===),监听并捕捉变量变化。 前端同学以Vue中的Watch监听为嵌入点更好理解。 装饰器说明装饰器参数: …

@Resource 和 @Autowired 的区别

@Autowired 和 @Resource 都用于在 Spring 中进行依赖注入,但在来源、注入方式、支持的参数和用法上存在一些差异。​1、来源不同@Autowired:​Spring 自身提供的注解,位于 org.springframework.beans.factory.annotation 包中。​ @Resource:​Java标准中的注解,位于 jav…

harmonyOS基础- 快速弄懂HarmonyOS ArkTs基础组件、布局容器(前端视角篇)

大家好!我是黑臂麒麟,一位6年的前端;if youre change the world, youre workingon important things. youre excited to get up in the norning.一、常用基础组件 1.基础组件 简单列举常用的及含义,掌握了以下按钮可以解决日常简单场景需求。其他在使用时查询ArkTS的API文…

ai出错、不严谨的体验

一、例子1 用一个包含80多名学生成绩的PDF文件,让ai对学生成绩进行加减乘除的计算(保留两位小数),计算结果降序排列。结果部分学生的结果计算错误(最大差距有3分左右),部分学生的结果是正确的 我不知道是不是因为涉及到除法导致部分结果出错,我用了元宝deeepseek和豆包…

第5章 编写异步代码

第5章 编写异步代码 5.1 异步函数简介 C# 5 引入了异步函数的概念。异步函数可以指某个由 async 修饰符修饰的方法或者匿名函数,它可以对 await 表达式使用 await 运算符。 5.2 对异步模式的思考 5.2.1 关于异步执行本质的思考 await 在 C#中的任务本质上是请求编译器为我们创…

Spring Cloud Gateway 与 Knife4j 集成实践

注意:写于 2025/1/10,未来时间可能失效,请根据具体情况实践。在微服务架构中,Gateway 通常承担着路由转发、负载均衡、鉴权等职责,而 Knife4j 是一个集 Swagger2 和 OpenAPI3 为一体的增强解决方案,可以帮助开发者快速聚合使用OpenAPI 规范。 本文参考 Knife4j 文档,进行…

用户说:10分钟用通义灵码搞定“今天穿什么”!打开爽文世界……

当我仅用10分钟调教出一个会关心我穿不穿秋裤的管家时,突然想到,现在限制我们开发的已经不是编程能力,而在于你有没有把你的想象力塞进代码框!作者:ZLJ,浙江大学教育技术学研究生 当我仅用10分钟调教出一个会关心我穿不穿秋裤的管家时,突然想到,现在限制我们开发的已经…

Cyber Apocalypse 2025 forensics WP

Cyber Apocalypse 2025 forensics WPCyber Apocalypse 2025 WP 做了国际赛之后虽然(目前只做了两道,可是没环境了啊,前几天比赛有点多~www),只从取证这边说,感觉他们的题很有趣,情境也给的很真实连贯,出题灵活,就是能见到很多新兴的知识,拓展知识面,以后会多看一看…

python第六周作业(第四章课后程序练习题)

4.1 import random def guess_number(): target = random.randint(1, 100) count = 0 while True:guess = int(input("请输入你猜的数字(1-100): "))count += 1if guess < target:print("猜小了")elif guess > target:print("猜大了")else…