博客/工程

如何快速掌握新的合成Grafana云监测特性

2021年1月27日 10分钟

我们最近推出了综合监测,这你可以更好的理解你的用户的经验和提高网站性能积极监控你的服务。这个特性,表面的强大功能普罗米修斯黑箱出口国,是worldPing的下一次迭代。

新的合成监测功能是提供给所有Grafana云用户——包括那些最近宣布免费计划,它允许多达10000系列普罗米修斯或石墨指标和50 GB的日志。与Grafana云,你可以看看发生了什么在你通过托管服务和系统指标,日志和跟踪,在三者之间进行切换。

让外部的观点你的服务和系统,您可以设置检查使用合成监测。

“worldPing 2.0”

而worldPing是一个伟大的工具,一个“返回”视图的基础设施的可用性,这背后的新的综合监测功能的概念和提高一个数量级。

最值得注意的改进是在综合监控的接口。worldPing试图发现一组协议探针(ICMP、DNS、HTTP [S]端点),然后让这些在同一页面的配置。然而,这可能会导致很多杂物,使创建和更新检查繁琐。其次,worldPing主页提供端点的检查列表,以及链接到单独的指示板不同的协议检查,但是没有简单的方法来得到一个“返回”概述的所有测试端点。

综合监控明确地分离出协议的配置检查(和许多详细的补充进行检查),以及利用一个主页,立即显示你所有的健康检查,按协议分组。

综合监测最显著的变化是它使用托管指标和日志,你已经Grafana云存储数据进行的检查。

普罗米修斯的力量

除了通过存储日志和指标洛基普罗米修斯,还有许多其他的好处我们的综合监测功能,来自被建立在普罗米修斯黑箱出口国。

首先,普罗米修斯黑箱出口国,进而综合监控、提供能够创建萍,HTTP / HTTPS, TCP、和DNS检查,与众多的配置选项,我们将深入研究在本文的后面。

合成监视是建立在普罗米修斯警报警报。目前,这些警报可以编写使用文本框编辑器在Grafana云提醒,它使您能够编写快速警报没有任何额外的工具,下载,或者命令行。此外,我们很快就会发布新的警告标签在综合监控,你将能够为合成设置警报监控检查使用合成输入正确的UI。当然,这些警报将被创建为普罗米修斯警报后端,因此将可编辑,也可以从云Grafana报警。

最后,因为合成监测发布普罗米修斯指标和洛基日志,您可以组合这些指标与其他数据自定义日志查询和仪表板。可以引用多个普罗米修斯数据源在一个查询,或者把不同的查询到多个面板在同一仪表板。

安装和配置

让我们深入得到综合监控安装到Grafana实例。有两种不同的方法合成监测运行,但是所有的方法都需要一个Grafana云帐户正确存储数据和函数。

在你Grafana云账户,直接导航到综合监控图标左边的导航栏。在这里,您可以访问主页,介绍检查按检查类型分组;检查页面,您可以查看现有的检查和创建新的检查;和一个配置页面,您可以查看在Grafana云栈合成监控安装。

添加一个初始检查

一旦安装到你的Grafana合成监测实例,是时候添加一个检查!

打开合成监测工具条菜单并选择检查

选择新检查从检查页面,它将带你去一个新的检查页面。

我们要添加一个新的平(也称为一个ICMP回应)检查,以确保我们的grafana.net服务器总是可以从世界各地不同的地方。选择作为检查类型。

输入Grafana-Ping作业名字段,然后设置grafna.net随着目标(这是一个故意错误,忍受我们!)。

现在我们需要选择使用探针的位置在这个检查。探针是一种黑箱的代理商遍布全世界,可在广泛的位置,负责实施配置的检查指定的目标。每个探测指标和日志发送到综合监控后端,包括目标等信息可用性和健康和响应延迟,然后在综合监视仪表板中呈现。

现在,选择几个不同的位置探测器,将发送ICMP回应数据包(ping)grafana.net主机。通过选择的呢调查地点菜单的探头的选择部分。在下面的示例中,您将看到我们选择伦敦,东京,西雅图,孟买,悉尼

探头的选择部分允许您配置应该如何进行经常检查,以及超时。超时将萍检查标记为失败如果没有收到IGMP回波响应超时周期内。

如果你展开最后的部分,高级选项,您会注意到,这里有额外的配置选项允许您设置额外的标签指标和日志(你可以使用的PromQLLogQL查询标签选择器)。你也有能力改变所使用的互联网协议版本(IPv4, IPv6,或者两者兼而有之)和决定是否设置“别片段”(IPv4只)。

我们要坚持现在的默认选项与IPv4和测试。萍检查页面现在看起来应该像下面这样:

最后,选择保存按钮。

检查列表

你会带回检查列表,这将给我们的新的检查已经注册。首先,你会看到一个问号(吗?)在检查显示没有当前信息检查卫生。这将改变第一止回阀进行了一次。

现在你会看到萍检查的检查列表,显示检查是活跃的。一会儿一个红色后,破碎的心萍旁边会出现检查标志。这表明检查失败!也会有成功率将被设置在与它相关联的N /一个(不适用)。我们可以跳转到这个特定的仪表盘检查通过选择合成监视仪表板图标之间的四个方块)(检查类型()和成功率

萍仪表板

一旦选定,萍的仪表盘检查将被打开,它会看起来像这样。

注意,仪表板的顶部有三个可选的仪表板变量:探针,工作,实例。的探针变量允许您选择一个探针的更多详细信息返回的指标。(所有选择默认情况下,使用平均的探针配置的检查)。的工作萍的工作显示的信息,我们目前只有一份工作,这是设置为Grafana-Ping。最后,实例变量允许您找到所有之前的实例的目标。

这里有一些有趣的电池板,尽管他们是空的。正如你可能已经猜到了,因为这是目前检查失败。的停机时间面板显示的位置的探测,我们添加了检查。红色显示从探针检查失败,而绿色显示了一个成功的检查。还有一个数据面板显示平均延迟检查的频率(目前60秒),和正常运行时间检查目标。

检查失败是为什么?嗯,我们做了一个印刷错误时指定的目标grafana.net当我们检查配置服务器。看一看错误日志。*:grafna.net面板(包括目标错误)。你会看到一组重复的错误,看起来像这样:

2021-01-22 17:52:35水平目标= grafna.net味精= = info”解决目标地址“ip_protocol = ip4 2021-01-22 17:52:35水平= info目标= grafna.net味精=“开始检查”类型=萍timeout_seconds = 3 =错误目标= grafna.net味精= 2021-01-22 17:52:30水平“检查失败”duration_seconds = 0.000799491 = 2021-01-22 17:52:30水平警告目标= grafna.net味精=“错误解决地址”呃=“查找grafna.net 127.0.0.1:53:没有这样的主机”2021-01-22 17:52:30级别=错误目标= grafna.net味精=“决议与IP协议失败”错误=“查找grafna.net 127.0.0.1:53:没有这样的主机”

这表明grafna.net目标没有返回一个ICMP回应,因为它无法联系(在撰写本文时,这个主机不存在)。

看了日志和检查失败的原因决定的,你现在可以回到这张支票的配置页面改变它。

这通过使用吗综合监测菜单的检查项,然后选择失败Grafana-Ping检查。这将带你回到检查配置屏幕。改变目标grafna.netgrafana.net,然后选择保存在页面的底部。

改变目标后不久,回到的仪表板页面检查。现在你可以看到,检查是否正常工作,然后你从所有六个调查获得数据。

检查,检查,检查!

我们给你简要概述如何创建和查看萍检查与综合监控,但实际上有四个不同类型的检查,可以用来确保您的基于web的应用程序的可用性,可以随时为客户服务:

    • 测试主机使用ICMP回应数据包的可用性,确保反应发生在一个指定的超时。
  • DNS

    • 确保DNS查找指定超时时间内进行。您可以指定返回的记录类型和名称服务器使用,并允许预期的响应代码和一个正则表达式来验证返回的记录。
  • HTTP [S]

    • HTTP和HTTPS检查包括丰富的配置功能,包括:

      • 其他方法用于请求,以及可编程的身体和头部和授权选项。
      • 为响应验证标准,包括返回的状态码,HTTP版本检查SSL选项,指定regex返回的身体和头部的能力。
      • TLS选项指定服务器和客户端证书和密钥。
  • TCP

    • TCP的具体检查包括HTTP (S),但针对通用的TCP负载。

此外,合成监控允许您创建自己的私有,blackbox-exporter-based探针,这带来他们灵活地从任何位置创建可用性检查要安装到世界各地。

REST API的功能。以编程方式提供检查功能和存储检查数据,普罗米修斯指标和洛基日志。在仪表板选项包括端点可用性可视化你已经监测基础设施。所有这些意味着合成监测水平显著高于其worldPing遗产。

在未来的文章中,我们将深入研究深度上可用的其他类型的监督检查,以及创建私人调查和使用REST API。

同时,只要登录你的Grafana云账户为自己尝试合成监测。如果您目前不使用Grafana云,你可以注册一个免费14天的审判的职业计划探索无限的度量、日志和用户,长期保留,团队协作功能,等等。之后,你就会自动移动到新的自由层,它给你免费获得我们的可组合的可观测性平台有10000活跃系列,50 GB的日志,对指标和14天保留日志。了解更多关于自由和职业计划在我们的网站上