博客/工程

如何在Grafana Cloud中使用开箱即用的仪表板管理基数

2022年2月28日7分钟

当有一个基数爆炸,它会导致问题:它是一个意外,它是噪音,它会增加您的成本或导致系统性能下降。

在过去的一年里,我们改进了时间序列存储系统所以在正常使用下,高基数不再是一个问题。但是作为可观察性平台的操作员,您应该拥有帮助保护基础设施所需的工具。

这就是为什么格拉夫纳实bob电竞频道验室创建了我们的基数管理仪表板:一套3个仪表板提供帮助Grafana云用户(专业和高级)跟踪他们的指标基数。

我们的基数管理仪表板使您能够从广泛的视角到更有针对性的视角分析数据。这些指示板背后的思想是从概述指示板开始,然后向下钻取有关特定指标或标签的更详细信息。这个工具有三个仪表板:

  • 概述仪表板
  • 指标指示板
  • 标签指示板

Nestlé技术主管Reza Farshkaran说:“一个仪表板可以显示1000多个单词,基数管理仪表板就是这样。”“这些仪表板不仅提供了一种监视和管理基数的好方法,而且还帮助我的团队向同事解释基数。”

概述仪表板

概述指示板显示单个选定数据源的度量和标签之间的基数信息。您可以使用这个指示板来判断某个数据源是否具有大量的序列,并了解从哪里开始寻找高基数的来源。基数指示板允许您单击度量名称和标签名称,它们分别将您直接链接到特定于度量的指示板和特定于标签的指示板。

Grafana基数仪表板:概述仪表板。

开始思考你的前10个指标和前10个标签,并问自己是否可以删除一些标签,因为它们提供给你的信息是你没有积极使用的(也就是说,你并没有按照这些标签进行分组或筛选,也不打算在未来这么做)。接下来,就整个度量标准问自己同样的问题。这个公制是让你开心,还是在你的衣橱里尘封?

格拉芙娜红衣仪表盘:近藤麻理惠表情包。

从标签的角度来看,考虑减少每个标签的值的数量可能会很有趣。例如,假设您有一个返回各种类型的web服务状态码.大约有50个。虽然您可能永远不会遇到所有这些,但您甚至可能不需要知道全部细节,也不需要决定为您的特定用例只存储状态代码的类,这将使您减少到5个可能的值。或者您只存储您关心的6个最常见的特定状态码,并将其他的状态码封装在带有值的单个标签中其他

减少每个标签值的数量或删除完整标签的更好解决方案是将本例的数据存储为日志,将日志行发送到Grafana洛基.这允许您通过完全删除标签或整个指标来减少基数,同时仍然能够将信息与其他指标关联起来,并聚合信息,以一种更具成本效益的方式创建具有完整信息的指标仪表板。

总之,你有3个选择:

  • 保留度量/标签,因为你在乎它。
  • 删除度量/标签,要么是因为您不需要它,要么是因为该信息在日志中可用或可以在日志中提供。
  • 减少某个标签的值的数量。

指标指示板

此指示板帮助您理解单个度量的基数。在仪表板的顶部,您可以选择想要研究的数据源和指标。

Grafana基数仪表板:度量仪表板。

考虑上面带有HTTP状态码的示例,您可能会发现跟踪状态码值的标签特别高,并决定按照上面概述的那样对其进行操作:保留、删除或减少。

标签指示板

此仪表板显示所选标签的基数报告。对于给定的数据源和标签名称,它将显示附加到最多系列的标签值。它还显示了给定标签-值对的最高基数指标。

标签仪表板在向您显示最常用或最重要的标签值时特别有用。它还可以帮助您识别标签值在所有使用的指标之间的任何不平衡。您可能已经决定保留某个标签而不减少值的数量,因为它对您的特定用例很重要。然而,在标签指示板中,您可以识别使用此标签的指标为你提供价值。考虑删除整个指标或特定指标的标签,以最终减少基数。

Grafana基数仪表板:标签仪表板。

这个仪表板的另一个用途是帮助您在较高的层次上理解您的系列从何而来。假设你使用公共标签环境通过你的所有指标来表示它们是否来自生产测验,或发展环境。如果您使用标签仪表板来探索环境标签,您将能够看到由您的prodd,测试和开发环境生成的系列的百分比。也许你会注意到你的系列有50%是来自开发人员,这对你来说是出乎意料的。所以你可以专注于修改来自开发者的参数。

其他组织可能会使用这样的标签应用程序团队,或工作识别度量的来源。同样,使用这个指示板查看这些标签有助于理解您的系列分布。也许你意识到了应用程序1正在发送90%的系列。或者目前发送的序列是否超过5xb队即使它们只有一半大。

控制基数

为了控制基数,最重要的事情是理解哪些指标和标签对您和您的团队有用。不要储存超过你需要的信息。如果您发现自己处于需要更多信息的情况下,您总是可以稍后引入一个新标签或一个新标签值。三个基数指示板可以帮助您轻松地挖掘这些信息,并帮助您获得需要的数据,以便做出保留、删除或减少的决定。

让我们结合目前所学的内容做最后一个例子。假设我们有一个带有3个标签的度量。在实际场景中,通常情况是一个特定的标签值只允许另一个标签的特定值。为了使这个例子简单,我们假设每个标签有10个值,这3乘以10个标签值的每一种组合都可以出现。这样我们就有可能得到10 × 10 × 10 = 1000个级数。如本文所述,系统地使用基数仪表板,我们可以做几件事。下表显示了所采取行动的一些示例、它们对基数的影响、它们的业务影响,以及与所采取行动相关联的该指标的成本节约。

Grafana基数仪表板:基数操作表。

虽然这是一个相当通用的示例,但您仍然可以看到,小的更改可以产生相当大的影响。

我们希望Grafana的新基数指示板是有用的,我们希望得到您的反馈,告诉您如何使用它们,以及您认为可以如何改进它们以帮助控制基数。

如果您还没有使用Grafana Cloud—开始可观察性最简单的方法—现在就注册,免费试用Grafana Cloud Pro 14天,具有无限的度量、日志、跟踪和用户、长期留存和高级团队协作功能。