博客/工程

基数峰值和为什么他们是什么事?

2022年2月15日4分钟

Grabob电竞频道fana实验室,我们花了很多时间与我们的客户,和一些我们听到人们在广泛的组织,他们希望能够更好地管理基数的突然飙升。

在这里,我们会给你一个基本的概述的基数是什么和为什么它的可观测性设置的一个重要因素,尤其是当有一个戏剧性的上升。

基数是多少?

基本定义的基数是元素的数量在一个给定的集合。

的世界里普罗米修斯和可观察性,标签基数是极其重要的,因为它影响监测系统的性能和资源使用。

基数上升:基本图普罗米修斯的基数。
基数上升:基本图普罗米修斯的基数。

简而言之:基数是一个品牌的整体统计值。在上面的示例中,标签status_code5基数,环境的基数为2,度规的总体基数server_responses是10。

你可以有更低的基数(1:5标签值的比率),标准基数(接触的标签值比率),或高基数(1:10,000标签值比率)。

高基数时,你和你的团队可以开始面临挑战与可观测性系统,如高的资源使用情况。

请记住,基数系列对应的数量指标。所以在这篇文章中,我们将参考系列互换的基数。

什么原因导致基数峰值?

一些我们的客户带来很多基数的突然飙升,这是当一个度量与中等或低基数突然变成指标基数高。这种变化可以对可观测性系统的性能有很大的影响,你的底线。

上图显示了突然激增的基数是什么样子。看看左边的线斜坡上一点的图吗?有人可能会改变一些重新标记规则删除一个无关紧要的标签。然后你会注意到活动系列大幅飙升。发生了什么是,也许有人介绍了一个标签,可以有这么多值系列(又名你的基数)的数量迅速增加。这意味着团队产生了比以前更多的监控数据——或者,意外,太多了。

因此,当这发生了什么?当您测试您的代码和添加一个新的度量,有时候你比你需要附加更多的上下文。例如,如果你使用“user_id”的标签

  • 度量用户id将成为一个标签。
  • 普罗米修斯以来每标签创建一个系列组合,你会得到很多系列的一个指标,如果你有很多的用户。

你可能想知道:系列是太多系列发送多少?这都是为了保持明智的系列的总数,以及基数管理工具我们能帮助你做出这些决定。

上涨的成本基数

当高基数指标发送给你的可观测性系统,您开始使用太多的资源,这可以导致内存错误和系统崩溃。这可以让痛苦的经历对于那些团队负责保持公司或应用程序启动并运行。

突然基数峰值不只有对可观测性系统产生负面影响,但它也会导致增加你的支出。

Grafana云,Grafana云指标的数量活动系列(和金刚石)。一个活跃的系列被认为是活跃的,当数据点增加了在过去的15到30分钟。如果你体验突然激增基数成倍增加的数量指标你发送,您的账单也会增加。所以控制基数可以有一些真正的成本效益。

了解更多

虽然我们希望这给你一个概述的基数是多么重要,我们有额外的资源,以帮助您更好地理解和管理堆栈基数。

Grafana企业指标文档基数分析配置和指示板:
Grafana企业指标:基数概述

如何使用基数管理仪表板与Grafana云:
分析指标使用基数管理仪表板

如何将日志和指标基数来解决相关的问题:
如何警惕高基数数据与Grafana洛基

如何使用cortex-tools发现未使用的高基数的指标:
如何快速找到从Grafana云未使用的指标和获得更多的价值