博客/工程

Grafana如何帮助组织管理跨多个监控数据源SLOs

2021年7月23日 3分钟

“SLO sr的最喜欢的词,”Grafana实验室主要软件工程师Bjbob电竞频道orn“Beorn”Rabenstein说在他在KubeCon + CloudNativeCon NA 2019。“当然,这也是伟大的设计决策,制定正确的目标,并以正确的方式来设置提醒。一切是好。”

所以当事情变坏,会发生什么?

报警的基本理念服务水平目标(SLOs)是测量出错率在不同的时间框架,然后警报。你页面很快如果你每月预算误差的快速燃烧,你只有票人如果误差预算足够燃烧缓慢,反应在工作时间是可以接受的。

网站可靠性工程师(sr)通常确定应用程序的健康和性能通过密切跟踪一组服务水平指标(图书馆)。在这篇文章里,我们会回顾Grafana使可视化学校图书馆和误差预算简单和容易当你SLO岌岌可危。

一个两全其美的办法

图书馆通常与多个衡量指标和APM系统的解决方案。bob彩票中奖计划

你是否使用数据源Prometheus-based与否,Grafana企业-自我管理环境的可观测性堆栈有独特的能力汇集不同的数据源到一个全面的概述。所有的信息可以组合成交互式仪表板,使用服务器端数学表达式统一预算来自多个来源的错误。

例如,整体SLO图可以创建通过结合过去30天的报告的数据来自两个学校图书馆Grafana云指标和批准的。

  • 误差预算SLI 1 (Grafana云指标)+误差预算SLI 2(批准的)

SLI过高的违规行为和错误的预算也可以突出使用Grafana内置的基于规则的格式。的信息可以很容易地共享一个更广泛的观众:所有电池板Grafana出口和embedable用于下游系统。

创建和行动图书馆

学校图书馆可以测量单一实体主机,豆荚,或服务,或跨多个实体使用度量标签。

Grafana企业指标Grafana云指标学校图书馆从Prometheus-based数据源使用PromQL的力量。Grafana云-我们完全可观测性管理堆栈和Grafana企业都有能力创建和管理通过API或学校图书馆Grafana下一代提醒插件,这两个是灵活的和可操作的。

违反了学校图书馆时,他们可以通过与下游系统集成时喜欢PagerDuty, ProdMon或自动化端点提醒都是团队。

最好的部分?学校图书馆的数量没有限制,可以使用Grafana跟踪。一些Grafana最大的客户监视成千上万的应用程序,从而跟踪成千上万的学校图书馆在他们的环境。

建立有效的SLOs和学校图书馆是最佳实践,你想把你的组织,以确保系统的正常运行时间没有燃烧你的团队。和Grafana使得这些指标设置和监控的过程无缝的。

要求演示Grafana企业,点击在这里。或者注册一个免费Grafana云试验,学习更多在这里


在这一页上
滚动的更多