博客/工程

Grafana仪表板:一个完整的指南,您可以构建各种不同类型

2022年6月6日 15分钟

编者注:这篇博客更新于1月9日,2023年,以反映我们的最新版本

有一个关于使用Grafana普遍真理:仪表盘很容易创建,但没那么容易组织。

随着组织规模的扩大,有高风险的仪表板扩张,当仪表盘的混乱。随着用户数量的增加,那么他们的仪表板输出。

我们的仪表板管理指南概述的功能,帮助组织仪表板,但是仍然存在两个难点:

  1. 没有很多细节、例子或意见用户如何分类和分类Grafana仪表板。
  2. Grafana仪表板的文件夹结构,因为它是目前实现的,是有限的。你不能创建子文件夹,只有一级文件夹。这不是明显的如何有效地使用它们。

在这篇文章中,我将列出并描述目前存在的所有不同类型的Grafana仪表板(基于我自己的研究和我的经验在过去的五年里使用和支持Grafana)。虽然我不建议一个明确的组织结构(这总是取决于你的业务,你的团队的工作流程,和公司文化),我希望这个Grafana仪表板列表可以帮助你把所有用例分类方案应包括。在审查所有不同类型的Grafana仪表板,您可以选择哪些故事相关的业务流程,人,和团队。

我也希望这个综合列表可以帮助你认为你可以做更多的新事物与Grafana !

使用仪表板/红色

这些Grafana仪表板是建立在使用和红色的方法。

使用量度(利用率、饱和错误)是面向硬件资源的基础设施。他们帮助你了解你的机器做什么问题可能的原因。

红军度量(请求、错误、持续时间、饱和——也被称为四个金色的信号)是面向服务的,他们也有可能你想要提醒的。红军仪表盘告诉你你的服务表现,是一个很好的代理用户的体验。

使用仪表板和红色尤其适用于网站可靠性工程师。他们是视觉上非常简单,制服,主要组成时间序列的面板。通过标准化仪表盘整个组织使用这些方法,运营商可以解释指示板在不同的团队效率。指定Grafana仪表板为“使用”和“红色”标题也可以帮助在给定的上下文中找到合适的仪表板。

bob电竞频道Grafana实验室技术和副总裁“Grafana大帐篷”播客主持人汤姆•威尔基描述了使用和红色的方法更深入GrafanaCon欧盟2018年博客和视频链接。

概述和深入仪表板

Grafana,钻唐斯聚合视图详细视图的实现不同Grafana仪表板之间的连接。概述仪表板显示聚合指标对整个基础设施或服务。你将有一个二级仪表板,显示更详细的指标对基础设施的子集或单个组件实例。

这通常是使用来实现仪表板的链接,数据链接URL变量。还有一个演示下钻的底部的链接这Grafana仪表板play.grafana.org

业务/流程仪表盘旅程

成千上万的企业使用Grafana仪表板想象他们的顾客流,供应链,和操作。你可以找到许多例子从不同的行业对我们成功的故事和案例研究页面。这里有一些选定的例子:

研发仪表板

仪表板的开发是一个迭代的过程。用户应该有地方来挽救他们的测试和在制品仪表板。您可能还想实现未完成的仪表板的政策应该只存在于登台环境,不在生产。

文件夹与用户或团队的名字可以帮助组织完成Grafana仪表盘——例如“AIOps草稿”或“行为研发”或“云平台在制品的数量。”还指出,研发仪表盘不应该标签和生产指示板,以避免它们出现在仪表板列表和链接。

指标探索仪表板

当我不熟悉的指标可用于一个系统,有时我构建一个指标探索仪表板。模板化的通用查询和重复的面板,这些Grafana仪表板让我浏览和发现给定数据源的有用指标。

仪表盘指标探索答案的问题如:

  • 我连接到数据源。现在怎么办呢?
  • 我添加了一个度量刮工作系统。可用的指标是什么?
  • 我能摆脱这个数据源的什么呢?

通过设计,仪表板是尽可能抽象和通用的。它是特定于数据源的类型;不能通用,适用于任何数据库。

变量提供一种方法来分类和指标基于前缀列表。

四个面板重复在每个指标,聚合值在四个不同的方面:

  • 平均:没有(实例)的avg(公制)美元
  • 总结:美元金额没有(实例)(公制)
  • 平均利率:没有(实例)的avg(率($度量[$ __rate_interval]))
  • 率总数:和没有(实例)(率($度量[$ __rate_interval]))
探索Grafana仪表板显示指标

度量是一个计数器或衡量,是否你可以看到指标以适当的格式的一个或两个列在上面的指标探索仪表板。每一行代表一个度量与四个不同的聚合操作。你可以滚动仪表板和发现你想要的指标表面面板(在不同的仪表板)或警报。

预先构建的仪表盘

有Grafana仪表板由他人以各种方式与社区和共享。

一些插件和Grafana数据源Grafana云集成包括预先构建的仪表板。例如,当您安装Grafana企业标准插件包括几个宝石监视仪表板来监督你的宝石集群的性能。

mixin集合Grafana仪表板,普罗米修斯警报,记录的规则由系统的集体经验的社区。他们可以是静态的仪表板和规则文件,或者更多Jsonnet程序可以包含在你的可观测性部署管道。一个受欢迎的mixin的一个例子Kubernetes mixin

bob电竞频道Grafana实验室举办公共指示板库。这是一个收集Grafana仪表板,任何人都可以发布。这是一个很好的例子的来源和灵感对许多具体的用例和数据源。在实践中,共享仪表板将让你也许50%或90%的到你想要的可视化(如果你找到一个数据源和应用程序)。但共享仪表板很少工作100%的你的情况的,和他们不常用。我通常喜欢从头开始构建自己的仪表板,但我会使用仪表板库作为灵感的源泉,例子,和想法。

仪表板的代码

仪表盘可以从代码生成,并自动发布到Grafana。这个概念也被称为仪表板的代码覆盖在最近的一次GrafanaCONline会话,您可以免费观看需求。仪表板的代码是一个仍在发展。周围的API和工具这个用例不完全稳定,不涵盖所有面板和可视化选项。然而,它是非常有用的;我们有一个会议开始管理Grafana代码使用HashiCorp起程拓殖我们今天展示生产流程可能会是什么样子。

这里有一些过去和当前的计划。请注意,不要指望依靠这些技术从长远来看。他们可能改变或最终放弃了,但其中的一些项目可能成为未来黄金标准仪表板代码。

Grafana有两个主要设施自动化:

大屏幕上指示板

这些是仪表板设计为开放式工作区显示在大屏幕上。他们是受欢迎的电视台和可能很快卷土重来。

他们经常做的统计,,杆规面板。他们也可能具有使用的表和表字段。他们通常利用阈值与使用价值。

这种仪表板的设计意图之一是提供一个即时情绪阅读,没有深度的细节。如果仪表板显示状态或警报信息,它通常会指定什么坏了,而不是原因。(运营商将开放更详细的红色/使用仪表板。)

报告指示板

报告是一个Grafana企业只有功能。

类似于大屏幕指示板、仪表板提供了一个快速概述报告,除了输出媒体是一个PDF文件附加到电子邮件。一个典型的用例是为高层管理人员提供分析和概述一般不会登录Grafana在日常工作。

指示板用于监控通常不自然转换成PDF,因此用户通常会创建专为报告和仪表板调整布局PDF,直到它看起来不错。查看最近如何更新了报告用户体验在Grafana企业和Grafana Pro和高级用户。

警报分析仪表盘

这是一个新的完美的用例状态时间轴面板发布的Grafana 8

普罗米修斯生成合成警报指标使警报可查询的历史。

Grafana仪表板显示警报分析。

在顶部面板中,我使用了国家的时间表面板与值的映射。我制作这个PromQL表达式返回3 AlwaysFiring meta-alert, 2为发射警报,1等待警报。

马克斯(alertname alertstate) (3 * max_over_time(警报{alertname =“AlwaysFiring”} [$ __interval])或2 * max_over_time(警报{alertstate =“解雇”}[$ __interval])或max_over_time(警报{alertstate =“等待”}[$ __interval]))

这是值的映射是什么样子:

截图Grafana UI Grafana报警值的映射。

底部面板历史地位使用以下查询:

数量(alertname) (max_over_time(警报{alertstate =“解雇”}[$ __interval]))

我把100 max数据点的查询选项我使用“橙色系(值)”的配色方案。还有一个配色方案覆盖AlwaysFiring时间序列的绿色。

Grafana遗留警报指示板

之前介绍了统一报警Grafana 8警报是紧密耦合的,图形面板(取代时间序列可视化因为v7.4)。因此,对用户仪表板布局创建警报。常见的做法是创造一个仪表板的唯一目的“停车”警报图面板。这种风格的创建警报被认为是一个年长的或“遗留”功能,同时用户可以回滚到使用这些仪表盘面板在Grafana 9中,我们将正式Grafana 10删除此选项。

相反,您可以使用Grafana报警的增强功能,默认启用的Grafana 9。了解更多,看我们最近GrafanaCONline 2022会话”提醒Grafana 9:新的和改进的”,这是可用的。

Meta-monitoring仪表板

Meta-monitoring仪表板显示有关您组织的指标监测和可观察性堆栈。它们保存在一个单独的文件夹,因为观众是有限的可观测性平台管理员。

用户转向meta-monitoring Grafana仪表板可视化内部指标收集从他们的可观测性组件:Grafana,普罗米修斯,Grafana代理,Pushgateway,Alertmanager,Grafana洛基等。几乎每个组件的Grafana /普罗米修斯在生态系统暴露指标/指标路径上的HTTP端口(默认端口号为每个服务)是不同的。

参见:

问题仪表板

这是一个类型的Grafana仪表板为调查创建一个特定的问题。他们的使用范围是有限的时间,之后他们过时或陈旧。

你可能会说,Grafana探索这个用例是正确的工具,因为它允许您运行特别一次性查询。但是如果这是一个难于诊断的问题你一直在追逐几周或几个月吗?

我认为有一个仪表板等建立一个文件夹。你也可以添加一个时间戳或一个数字仪表板标题问题。

参见:

主仪表盘

你可以很容易地自定义主仪表盘在Grafana为您的用户提供方向。

主仪表盘可以设置在组织层面,团队层面,或者Grafana用户水平。

虽然大多数Grafana用户不这样做,小的团队可能会发现它有用。我一直推荐定制仪表板为大型团队和公司。

有三个方法来指示板:

  1. 光的方法。保持原来的内容,但与自己的仪表板顶部添加一行列表。
  2. 重的方法。构建一个完全自定义仪表板。
  3. 企业的方法。构建一个自定义仪表板为每个团队。

什么家里仪表板:

  • 信息文本面板解释是谁管理这个Grafana实例,什么是监控,谁联系寻求帮助。
  • 仪表板列表面板使用标签动态管理。

演示和培训仪表板

这些Grafana仪表板出现到处都在Grafana实验室。bob电竞频道他们帮助我们证明Grafana的价值,他们的灵感来源,例子,和最佳实践。

我们有https://play.grafana.org,我们的公共Grafana的演示实例。我们也有其他一些未访问仪表盘中使用各种销售和培训环境。他们有时连接TestData数据源插件,或者一个数据源与数据生成器生成可预测的指标。

新的堆栈(TNS)是“一个简单的三层演示应用程序,与可观测性的三大支柱:完全检测指标,日志,和痕迹。“我们的解决bob彩票中奖计划方案工程师使用其包括Grafana仪表盘展示现代可观测性堆栈是什么样子,它就像主在不同类型的可观察性数据。

如何组织Grafana仪表盘

所以,不管什么类型的Grafana仪表板你决定建立,你打算如何组织你所有的指示板?

  • 你会每个团队创建一个文件夹吗?或多个文件夹/团队,这样他们就可以组织不同的仪表板类型?
  • 你会给用户个人沙箱文件夹在您的分期Grafana实例?
  • 外会有一些仪表盘管理Grafana VCS和供应通过你的DevOps工具吗?

这里有一些例子如何组织你的仪表盘。

Salesforce

我建议查看点播会话”使用Grafana堆栈可视化和管理总体服务健康和警报,“2021年GrafanaCONLine表示Salesforce团队。John O ' brien在23:47表示,谈到“仪表盘,工作”和股票的指导方针和建议为创建和组织广大读者仪表板。

他将仪表板分为三个主要类型:趋势,卫生检查和性能监控。30:00成他的谈话中,约翰股票他们的一些指示板质量标准仪表板作者,这有助于他们之间找到一个平衡的灵活性和秩序。

Kubernetes监控

这是一个伟大的KubeCon大卫Kaltschmidt交谈,总结的过程进化Kubernetes监视仪表板:bob电竞频道Grafana实验室KubeCon:万无一失Kubernetes仪表板对睡眠不足的电话。这就是仪表板成熟度模型来自。

我自托管“瞭望塔”

我和我的哥哥和我自托管服务运行,维持我们使用普罗米修斯和Grafana监控和可观察性的解决方案。

主屏幕的截图作者自托管的瞭望塔可观测性的解决方案。

上图:主仪表盘上我个人Grafana实例。我只是添加一行以上的原始Grafana内容与文本面板和一些仪表盘面板列表。

这是我在Grafana实例组织仪表板文件夹:

  • 亚历山大存档

    • 墓地的仪表盘我不再使用,但想要在我想重用一些查询或可视化。
  • 亚历山大的问题

    • 仪表板为调查具体问题。
    • 标题是“yyyy-mm-dd”格式化日期的前缀。
  • 亚历山大刺激

    • 仪表盘我经常使用但不用于我的兄弟。
  • 亚历山大研发

    • 仪表板草稿、半成品测试。
  • Meta-monitoring

    • Grafana Grafana洛基,普罗米修斯,普罗米修斯的目标状态。
    • 普罗米修斯指标探索。
  • 一般

    • 生产仪表板是有用的我的哥哥和我。
    • 标签是用来组织仪表板在仪表板板在主仪表盘列表,和相关指示板连接在一起。

了解更多关于管理Grafana仪表板

作为一个通用仪表盘平台,Grafana不执行或建议一个组织方法保持Grafana仪表板整洁。相反Grafana提供文件夹,标签、团队和设施和权限允许用户自定义和建立自己的仪表板系统,为他们工作。

我希望以尽可能多的仪表板类型可以在一篇文章中,我可以帮助你建立一个好的分类系统的基础,然后您可以转置到文件夹和仪表板的命名约定。

想要了解更多关于如何组织仪表板,阅读我们的文档:

在结束之前,我建议看开始使用Grafana仪表板的设计网络研讨会仪表盘上的需求,因为它很好地设计原则,并提供例子最常见的仪表板和用例类型。我认为这是一个伟大的演讲看不管你是刚刚开始与Grafana仪表板或您已经构建Grafana仪表盘了几年。

你有什么指示板类型并不在这篇文章中所描述的?请让我知道!我可以在我们的bob电竞频道Grafana实验室社区松弛

Grafana云是最简单的方法开始使用指标,日志、痕迹和仪表板。我们有一个慷慨的自由永远层和每个用例的bob体育手机二维码计划。现在免费注册!