博客/工程

使用新的Grafana云集成对RabbitMQ集群的基本指标进行监控和警报

2021年6月1日3分钟

我们很高兴地宣布RabbitMQ集成已经可用Grafana云,我们的可组合可观察性平台,将度量、日志和跟踪与Grafana结合在一起。

RabbitMQ是最流行的开源消息代理之一,在全球范围内用于小型初创企业和大型企业。它很容易部署在企业和云中,并支持多种消息传递协议。考虑到它的高采用率,并基于我们社区的使用统计数据和客户的问题,我们决定交付这个集成。

通过集成,Grafana Cloud用户现在可以轻松地监控和警报核心RabbitMQ集群指标使用Grafana代理,我们的轻量级可观察性数据收集器优化了发送度量、日志和跟踪数据到Grafana Cloud。

建立在社区的仪表板上

RabbitMQ社区已经有了神奇的仪表盘可用,涵盖集群的总体运行状况概述、内存消耗和一些其他场景。

我们在前两个仪表板上做了一些工作,并将它们与附加的过滤选项打包在一起,因此您可以下到节点级别,还可以检查汇总所有节点指标的整体集群信息。我们还使仪表板与底层基础设施无关,因为原始的仪表板是为Kubernetes环境量身定制的。

“RabbitMQ-Overview”提供了“RabbitMQ管理概述”页面上的所有可用信息,让您可以一目了然地了解任何集群的状态。

Erlang-Memory-Allocators分解了所有分配器和调度器的内存消耗信息。

打包了一些重要的警告

警报是可观察性策略的重要组成部分,应该根据具体情况进行调整,这样就不会引发假阳性。但是,无论环境如何,都可以对一些常见问题发出警报,例如,如果一个节点宕机或许多发送的消息不可路由。考虑到这一点,我们用这个集成打包了五个警告:

  • RabbitmqMemoryHigh:节点占用90%的已分配内存。
  • RabbitmqFileDescriptorsUsage:节点的文件描述符使用率达到最大值。
  • RabbitmqUnroutableMessages:集群无法将消息传递到目的地。
  • RabbitmqNodeNotDistributed:节点与集群失去通信。
  • RabbitmqNodeDown:节点down。

一键即可

与RabbitMQ的本地集成现在对Grafana Cloud用户可用。

它被设计用于RabbitMQ 3.8版本以上的版本,该版本附带一个官方插件,很容易启用,不需要专门的基础设施,也不需要特定的单独的二进制文件来运行。

如果您还没有使用Grafana Cloud,我们有免费和付费计划来满足每个用例-现在就免费注册.这是开始观察指标、日志、跟踪和仪表板的最简单方法。

要了解更多关于Grafana Cloud和RabbitMQ的监控和警报的信息,请加入Grafana Community Slack的#integration频道。

让我们知道你的想法

请继续关注关于如何最好地利用Grafana云RabbitMQ集成的后续内容。告诉我们你想看什么!您可以在我们的网站上与云集成团队聊天社区松弛