博客/工程

如何监视Ceph集群使用Grafana云

2021年10月20日 3分钟

在Grafanabob电竞频道实验室,当我们构建集成Grafana云我们经常思考如何帮助用户开始他们的可观测性旅程。我们要关注我们的一些您可能遇到的不同的技术。这样,我们可以分享我们的技巧最好的互动方式与他们当你使用Grafana产品。bob手机app官网

在这篇文章中,我将关注开源,Ceph分布式存储系统,我们的最新集成Grafana云(包括中可用永远免费的层)。

最基本的

Ceph实现对象存储在一个分布式计算机集群,然后提供3-in-1接口对象,块和文件级别存储。我们的目标是提供一个完全分布式操作没有单点故障,它允许您有可用性和选择范围。

为了实现这些目标,重要的是,每个核心组件的集群有冗余节点,即OSD(对象存储守护进程)和MDS(元数据服务器守护进程)。这确保数据复制到多个节点,因此,如果一个失败,你不会丢失数据。这同样适用于元数据节点,控制集群的整体配置。

也就是说,为了正确监控Ceph集群,我们必须关注这两个核心组件,这是一把锋利的部署的关键。

观察Ceph

这种集成监控Ceph集群基于内置的普罗米修斯插件

首先,使它在集群中使用下面的命令:

ceph经理模块使普罗米修斯

然后,您将需要配置Grafana代理刮你的Ceph节点。(请参阅集成文档在这里更多细节)。

集成由一个单一的和完整的仪表盘,它总结了Ceph集群的所有信息在一个单一的一瞥。它包括整个集群的信息,包括数量的OSD和监控节点上下;字节写/读和写/读吞吐率;IOPS;集群可用;使用和整体能力;延迟货币利率和分布;和更多。

这就是完整的仪表板的外观(4件):

我们也想确保你得到通知当集群有问题,所以我们创造了这些警报:

  • CephUnhealthy(基于整体健康指标ceph_health_status——如果这个指标不存在或者它返回不同的东西从1,集群是关键问题)
  • CephDiskLessThan15Left(警报警告如果有不到15%的容量左集群中)
  • CephDiskLessThan5Left(提醒重要如果有不到5%的容量左集群中)
  • OSDNodeDown(如果任何警报警告OSD节点向下)
  • MDSDown(提醒关键如果没有MDS可用集群中)

仪表板,这些警报是一个很好的方式开始监视您的集群即插即用的方式——这只会花费你几分钟让它的速度,这是我们的主要目标。

给我们的Ceph集成一个旋转,让我们知道你的想法。你可以联系我们Grafana松弛社区通过#集成。

Grafana云是最简单的方法开始使用指标、日志、痕迹和仪表板。我们有一个慷慨的永远免费的层和每个用例的计划。现在免费注册!


在这一页上
滚动的更多