博客/工程

开始使用Grafana OnCall起程拓殖

2022年8月29日 8分钟

待命安排管理和连锁升级,尤其是在许多团队,可以麻烦而且容易出错。这可能是特别困难的,如果没有代码工作流。

在Grafana OnCall团队,我们致力于使Grafana OnCall尽可能的易于使用。我们想要更容易减少错误和你随叫随到的日程,迅速创建时间表和升级模板,随叫随到管理融入现有的代码模式。

这就是为什么我们兴奋地宣布释放的起程拓殖提供者Grafana OnCall OSSGrafana OnCall Grafana云。(没有Grafana云账户?今天注册一个免费账户!)该起程拓殖提供者允许您管理您的集成,时间表,和升级Grafana OnCall代码。

我们将帮助您快速掌握Grafana OnCall并通过这开始指导起程拓殖。就让我们一探究竟吧。

连接到Grafana OnCall

起程拓殖成立于Grafana OnCall OSS和Grafana OnCall Grafana云

在大多数情况下,所需的步骤和起程拓殖指令之间是相同的Grafana OnCall OSS和Grafana OnCall Grafana云。关键的区别是,当使用OnCall OSS的起程拓殖提供者需要提供一个oncall_url参数的提供者。这应该是你的API的URL OnCall OSS实例。这个参数是所需Grafana OnCall Grafana云。

供应商“grafana”{oncall_access_token = " < YOUR_TOKEN >”oncall_url = " your_oss_instance_url "}

创建一个API牌

首先,您需要创建一个API牌开始管理你Grafana OnCall设置通过起程拓殖。这些步骤都是一样的你是否正在使用Grafana OnCall OSS或Grafana OnCall Grafana云:

  1. 设置选项卡的Grafana OnCall
  2. 找到API的令牌节并摁下创建按钮。
  3. 别忘了保存令牌,因为你无法看到它。

起程拓殖提供者配置

下一步是配置提供者。

Grafana OnCall包含在Grafana起程拓殖提供者,所以你只需要提供你的Grafana OnCall API令牌。

如果你想使用Grafana起程拓殖提供者与Grafana OnCall OSS您将需要提供一个oncall_url参数。它应该的url的API OnCall实例。

你可以看到如何做到这一点的一个例子如下:

起程拓殖{required_providers {grafana ={源= " grafana / grafana " version = " > = 1.22.0}}}提供者“grafana”{/ /我用别名为了方便管理因为grafana提供者包括部分grafana云,综合监测、等别名=“oncall”oncall_access_token = < YOUR_ONCALL_API_TOKEN >}

与Grafana OnCall

创建一个集成

现在,你有你的API的令牌,让我们创建一个集成。Grafana OnCall集成允许您连接到您所选择的监视系统,包括Grafana报警发送警报,Grafana OnCall。Grafana云用户将能够连接Grafana OnCall Datadog和New Relic的。

让我们创建一个!这是怎么做的一个例子如下:

资源”grafana_oncall_integration”“prod_alertmanager”= grafana{提供者。oncall名称=“刺激”类型=“alertmanager”default_route {}}

检查它们是否都是通过应用起程拓殖配置正确设置。您应该看到它出现在UI中像下面。

截图Grafana OnCall UI起程拓殖配置。

请注意:注意default_route块。这是默认你所有的警报的地方去。

配置升级

下一步是配置升级。升级决定时通知用户和组创建一个警告通知。警报升级有三个主要部分:

  1. 用户设置,你设置你喜欢或需要通知方法。
  2. 升级链,它可以有一个或多个步骤之后在触发通知。
  3. 一个路由,它允许管理员路线通知警报中基于元数据有效负载。

用户设置

OnCall可以控制如何通知用户通过用户设置页面内Grafana OnCall。(这是单独Grafana用户设置页面)。你可以看到下面的设置一个Grafana云用户通过微软团队通知通知第一个默认通过电话通知和重要通知。

注:微软团队仅可在Grafana OnCall Grafana云。

截图Grafana OnCall Grafana云UI中显示用户设置配置为微软团队。

创建一个升级链

接下来,创建一个升级链。我把它的名字默认的,因为我想连接到默认路由。

资源“grafana_oncall_escalation_chain”“默认”= grafana{提供者。oncall name =“默认”}

然后我将添加一个升级政策升级链。第一次迭代,我只会自己通知。

数据“grafana_oncall_user”“ikonstantinov”= grafana{提供者。oncall用户名= " ikonstantinov "}资源“grafana_oncall_escalation”“notify_me”= grafana{提供者。oncall escalation_chain_id = grafana_oncall_escalation_chain.default.id类型=“notify_persons”persons_to_notify = [data.grafana_oncall_user.ikonstantinov。id]位置= 0}

建立一个路线

最后一步是连接升级路线。修改default_route块集成上面创建:

资源”grafana_oncall_integration”“prod_alertmanager”= grafana{提供者。oncall名称=“刺激”类型=“alertmanager”default_route {escalation_chain_id = grafana_oncall_escalation_chain.default.id}}

一旦完成,应用这个配置更新。一旦运行,您应该看到类似于下面的截图你看到在你OnCall web UI集成页面,新创建的刺激是集成。

截图Grafana OnCall UI集成的刺激点。

现在,我们有一个非常简单但工作Grafana OnCall设置。

你可以看到完整的设置上面所描述的那样,在这tf文件

设立一个时间表Grafana OnCall

计划是一个关键的一部分随叫随到的工具。Grafana OnCall便于管理你的时间表通过整合iCal-based日历现在起程拓殖。

通过起程拓殖设置旋转随叫随到

让我们建立一个随叫随到旋转通过起程拓殖。我想添加我的同事玛Kukuy跟我随叫随到的旋转,并且我们每个人在呼吁一周一次,来回交替。

首先,我将导入一个新用户:

数据“grafana_oncall_user”“mkukuy”= grafana{提供者。oncall用户名= " mkukuy "}

时间表包括随叫随到的转变。转变是一个时期一个个人用户调用。让我们先创建一个随叫随到的转变。我使用rolling_users类型,允许我改变这一转变取决于随叫随到的人频率参数。因为我要随叫随到工程师每周改变,我选择每周频率和通过所有星期的日子by_day参数与这种转变的一周的每一天。

资源”grafana_oncall_on_call_shift”“week_shift”= grafana{提供者。oncall名称=“周转变”类型=“rolling_users”开始=“2022 - 06 - 01 t00:00:00”时间= 60 * 60 * 24 / / 24小时频率=“每周”by_day =[“莫”、“你”、“我们”、“TH”、“FR”、“SA”,“苏”]week_start =“莫”rolling_users = [[data.grafana_oncall_user.ikonstantinov。id]、[data.grafana_oncall_user.mkukuy。id]] time_zone = " UTC "}

最后一步是创建一个计划并连接我的转变:

资源“grafana_oncall_schedule”“主”= grafana{提供者。oncall name =“初级”类型=“日历”time_zone = = [grafana_oncall_on_call_shift.week_shift“UTC”转变。id]}

包括这个升级计划,让我们修改默认升级链。我删除grafana_oncall_escalation.example_notify_step并创建一个新的通知我们的时间表:

资源”grafana_oncall_escalation”“notify_schedule”= grafana{提供者。oncall escalation_chain_id = =“notify_on_call_from_schedule”notify_on_call_from_schedule = grafana_oncall_schedule.primary grafana_oncall_escalation_chain.default.id类型。id = 0}位置

再次,应用配置。去日程安排选项卡Grafana OnCall。在那里你可以验证你的时间表在web UI或iCal链接通过出口并检查安排在一个日历,如谷歌日历。

与计划配置截图Grafana OnCall UI。

你可以看到创建一个调度部分中描述的设置tf文件

在路线Grafana OnCall

Grafana OnCall提供了路线的概念,它允许您基于元数据与警报警报。

让我们创建一个新的警报升级链是至关重要的。请参见下面的怎么做:

资源“grafana_oncall_escalation_chain”“关键”= grafana{提供者。oncall名称= "关键"}

然后让我们创建一个路线。你可以看到一个警告,它包含严重程度至关重要在元数据将被路由到关键升级链。

资源”grafana_oncall_route”“critical_route”= grafana{提供者。oncall integration_id = grafana_oncall_integration.prod_alertmanager。id escalation_chain_id = grafana_oncall_escalation_chain.critical。routing_regex id = " \ "严重性\”:\“关键\ "位置= 0}

违约和之间的区别关键升级是默认升级,我想等待5分钟前对这一事件做出反应(因为可能auto-resolved)。这限制了干扰待命的工程师。

为关键的警报,我想立即反应。让我们实现它。

首先,修改为默认链升级:

= grafana提供者。oncall escalation_chain_id = grafana_oncall_escalation_chain.default.id类型=“等待”时间= 60 * 5位置= 0}资源“grafana_oncall_escalation”“notify_schedule”= grafana{提供者。oncall escalation_chain_id = =“notify_on_call_from_schedule”notify_on_call_from_schedule = grafana_oncall_schedule.primary grafana_oncall_escalation_chain.default.id类型。位置id = 1}

然后,我们添加一个新的升级重要提醒:

资源”grafana_oncall_escalation”“notify_schedule_critical”= grafana{提供者。oncall escalation_chain_id = grafana_oncall_escalation_chain.critical。id =“notify_on_call_from_schedule”notify_on_call_from_schedule = grafana_oncall_schedule.primary类型。id = 0}位置

就是这样!应用配置,并确认一切正确设置在UI中。

截图Grafana OnCall UI与路由配置。

你可以看到创建一个航线部分中描述的设置tf文件

由什么来Grafana OnCall起程拓殖

团队已经使用Grafana OnCall OSS和Grafana OnCall Grafana云和计划转向基础设施代码,我们计划帮助他们迁移起程拓殖出口国即将到来!

更多关于Grafana OnCall OSS,你可以阅读我们的文档或者去Grafana OnCall GitHub回购

更多地了解Grafana OnCall Grafana云,请阅读我们的Grafana OnCall文档如何管理Grafana OnCall Grafana云起程拓殖或者查看我们的开始使用Grafana OnCall Grafana云网络研讨会在需求。

如果您没有看到你想要的功能,加入我们的社区电话或去Grafana OnCallgithub的讨论

最简单的方法开始59bob手机软件 是用Grafana云。永远有一个慷慨的自由层以及每个用例的计划bob体育手机二维码。报名今天免费!