博客/工程

如何快速找到从Grafana云未使用的指标和获得更多的价值

2021年7月2日 4分钟

“我希望有一个快速的方式看到顶部指标基数没有添加到仪表板。”- - - - - -斯蒂芬·蒂姆斯,Mailchimp的高级系统工程师

随着软件系统复杂度的爆炸,生成的数据量检测这些系统。这给我们的用户带来了一个问题——特别是那些负责团队可观察性和可观察性平台的大型企业。他们之间的平衡点了成本管理和给团队乐器任何他们想要的自由。通常可观测性领导人支持许多团队使用的是成百上千的仪表板。不容易找出哪些团队关心信号的可伸缩的方式。

当我们跟一群Grafana云用户对这个挑战,我们意识到如果我们能回答这个问题的指标并没有被使用,我们就能给用户一个快速的方式开始找出哪些指标问题。

我们兴奋地分享最近发布的设置的命令cortex-tools——我们的命令行工具进行交互Grafana云——这生成一个指标列表,在基数,未使用的。

一个未使用的度量的命令(分析命令)是目前作为度量定义,是一个活跃在Grafana云存储系列,但没有显示在仪表板在Grafana实例。

好的,让我们试一试。

开始

超级简单的开始。

  1. 首先,安装cortex-tools,一套强大的命令行工具与皮质进行交互。
  2. 创建一个Grafana API键。
  3. 运行cortextool分析grafana命令,。/ cortextool分析grafana——地址= < grafana-address >键= < api key >看到一列指标,绘制Grafana仪表板。
  4. 运行分析普罗米修斯命令,普罗米修斯。/ cortextool分析——地址= https://prometheus-us-central1.grafana.net/api/prom id = < grafanacoud-instance-id >——关键= < grafanacloud-api-key > log.level =调试看到一列指标,排名由基数,不用于Grafana仪表板。让您的云普罗米修斯的地址查询端点,请导航到普罗米修斯Grafana云门户。

没有显示的度量标准Grafana仪表板是去除的主要候选人。我们仍然建议检查与团队和利益相关者在删除之前,但是这个列表应该是一个很好的起点思考你的指标使用。记住,警报和查询所使用的指标或指标指示板,使用模板变量将被定义为未使用的。

为更多的细节在这个特性,查看文档

删除未使用的指标

现在,您已经有了一个指标,未使用的列表,你如何删除它们摄入吗?假设你看到metric_ametric_b不用于任何Grafana仪表板和过高的基数,你不希望他们。

如果你使用普罗米修斯或者Grafana代理发送指标Grafana云,你需要修改你的remote_write配置防止指标。

这是通过添加一个条目write_relabel_configs在你现有的remote_write配置。

例如:

remote_write: url: <云普罗米修斯度量实例remote_write端点> basic_auth:用户名:<云普罗米修斯实例ID >密码:<云普罗米修斯API key > write_relabel_configs: - source_labels: [__name__]正则表达式:metric_a | metric_b行动:下降

你可以找到remote_write URL、用户名和API键配置信息的普罗米修斯卡Grafana云门户。

这条规则查找任何度量值的标签__name__metric_ametric_b。的__name__标签代表的名字普罗米修斯的度量。规则使用正则表达式来匹配指标名称,所以你可以添加你想要尽可能多的指标,如果你单独|管道。

就是这样!感谢以下。我们已经算出了未使用的最高指标基数,我们删除了几个被发送。

接下来是什么

Grafana云很容易开始使用指标、日志、痕迹和仪表板。(如果你不已经使用它,看看我们免费和付费Grafana云计划为每个用例注册一个免费试用)。的一部分,我们的使命是让你控制你的数据。我们会听到你的爱当你尝试这个功能。寻找更多的在这一领域,我们改善的工具给你更多了解你使用的指标、日志和跟踪。


在这一页上
滚动的更多