;数据源;AWS监测

AWS监测数据源

Grafana附带对监测的内置支持。这个主题描述了查询、模板、变量和其他配置特定于监测数据源。说明如何添加一个数据源Grafana,请参考添加一个数据源。只与组织管理角色的用户可以添加数据源。

一旦你已经添加了监测数据源,您可以构建仪表盘或使用探索与监测指标和监测日志。

注意:故障诊断问题设置监测数据源时,检查/var/log/grafana/grafana.log文件。

配置监测数据源

访问数据源设置,鼠标的配置(齿轮)图标,然后单击数据源,然后单击AWS监测数据源。

身份验证选项和配置细节,请参阅美国焊接学会的认证的话题。

CloudWatch特定数据源的配置

我的政策

Grafana需要权限授予通过我能读懂监测指标和EC2标签/实例/区域/警报。你可以把这些权限配置的用户角色或我在前面的步骤。

指标只有例子:
{“版本”:“2012-10-17”,“声明”:[{“Sid”:“AllowReadingMetricsFromCloudWatch”,“效果”:“允许”、“行动”:[“监测:DescribeAlarmsForMetric”、“监测:DescribeAlarmHistory”,“监测:DescribeAlarms”、“监测:ListMetrics”、“监测:GetMetricData”、“监测:GetInsightRuleReport”),“资源”:“*”},{“Sid”:“AllowReadingTagsInstancesRegionsFromEC2”,“效果”:“允许”、“行动”:[“ec2: DescribeTags”、“ec2: DescribeInstances”、“ec2: DescribeRegions”),“资源”:“*”},{“Sid”:“AllowReadingResourcesForTags”,“效果”:“允许”、“行动”:“标签:getresource”、“资源”:“*”}]}
日志只的例子:
{“版本”:“2012-10-17”,“声明”:[{“Sid”:“AllowReadingLogsFromCloudWatch”,“效果”:“允许”、“行动”:[“日志:DescribeLogGroups”、“日志:GetLogGroupFields”、“日志:StartQuery”、“日志:StopQuery”、“日志:GetQueryResults”、“日志:GetLogEvents”),“资源”:“*”},{“Sid”:“AllowReadingTagsInstancesRegionsFromEC2”,“效果”:“允许”、“行动”:[“ec2: DescribeTags”、“ec2: DescribeInstances”、“ec2: DescribeRegions”),“资源”:“*”},{“Sid”:“AllowReadingResourcesForTags”、“效果”:“允许”、“行动”:“标签:getresource”、“资源”:“*”}]}
指标和日志的例子:
{“版本”:“2012-10-17”,“声明”:[{“Sid”:“AllowReadingMetricsFromCloudWatch”,“效果”:“允许”、“行动”:[“监测:DescribeAlarmsForMetric”、“监测:DescribeAlarmHistory”,“监测:DescribeAlarms”、“监测:ListMetrics”、“监测:GetMetricData”、“监测:GetInsightRuleReport”),“资源”:“*”},{“Sid”:“AllowReadingLogsFromCloudWatch”,“效果”:“允许”、“行动”:[“日志:DescribeLogGroups”、“日志:GetLogGroupFields”、“日志:StartQuery”、“日志:StopQuery”、“日志:GetQueryResults”、“日志:GetLogEvents”),“资源”:“*”},{“Sid”:“AllowReadingTagsInstancesRegionsFromEC2”、“效果”:“允许”、“行动”:[“ec2: DescribeTags”、“ec2: DescribeInstances”、“ec2: DescribeRegions”),“资源”:“*”},{“Sid”:“AllowReadingResourcesForTags”、“效果”:“允许”、“行动”:“标签:getresource”、“资源”:“*”}]}

名称空间的自定义指标

Grafana不能加载自定义名称空间通过GetMetricData API。如果你还想要你的自定义指标出现在查询中的字段编辑器中,您可以指定命名空间的名称包含在自定义指标名称空间的自定义指标字段。接受一个多个名称空间,中间用逗号分开。

超时

超时专门为监测日志查询。日志查询不认识标准Grafana查询单个请求超时,因为他们不开放,而是定期轮询的结果。因为限制并发运行查询的监测也可以更长的时间来完成。

链接一个x射线数据来源的“x射线跟踪链接”部分配置页面自动添加链接时,日志包含在你的日志@xrayTraceId字段。

跟踪链接配置

数据源选择的实例将只包含现有的数据源类型x射线为了使用此功能需要已经配置现有的x射线数据来源,明白了x射线文档获取详细信息。

x射线链接将出现在日志详细信息区域,可以通过点击日志行在探索或仪表板日志面板。记录@xrayTraceId在看你的日志AWS x射线的文档。提供现场Grafana还必须包含您的日志查询@xrayTraceId查询字段,例如使用字段@message @xrayTraceId

跟踪链接记录细节

CloudWatch查询编辑器

CloudWatch数据源可以查询数据监测指标和监测日志api,每个都有自己的专门的查询编辑器。你选择哪个API查询使用查询模式切换的编辑器。

CloudWatch API模式

度量查询编辑器

指标的查询编辑器允许您构建——两种类型的查询度量搜索度量查询

使用度量搜索选项

创建一个有效的度量搜索查询指定名称空间,指标名称和至少一个统计量。

如果匹配精确启用,您还需要指定所有的尺寸度量你查询,这样吗度量模式完全匹配。如果匹配精确被禁用,您可以指定任意数量的维度,你想过滤器。100标准将返回匹配你的过滤标准。

动态查询使用维度通配符

您可以监视一个动态的指标列表用星号(*)为一个或多个维度值通配符。

CloudWatch维度通配符

在本例中,查询返回所有指标的名称空间AWS / EC2指标的名称CPUUtilization和任何值InstanceId维度查询。这可以帮助您监控指标AWS资源,如EC2实例或容器。当创建新实例作为一个自动伸缩功能活动的一部分,他们会自动出现在图,你无须跟踪新实例id。此功能目前仅限于检索100指标。

你可以扩大查询检查员按钮,点击元数据看到搜索表达式自动构建支持通配符。了解更多关于搜索表达式访问CloudWatch文档。默认情况下,搜索表达式定义的方式查询指标必须定义的维度名称完全匹配。这意味着,在这个例子中只有度量一个维度的名称“InstanceId”将返回。

CloudWatch元检查员

你可以禁用匹配精确包括其他维度定义的度量。禁用匹配精确还创建了一个搜索表达式即使你不使用通配符。我们只是搜索任何度量匹配至少名称空间,指标名称和所有已定义的维度。

多值模板变量

基于多值模板变量在定义维度值,使用一个搜索表达式查询匹配的指标。这使得在一个查询中使用多个模板变量,还允许您使用查询的模板变量匹配精确选择禁用。

搜索表达式是目前限制在1024个字符,所以您的查询可能会失败,如果你有一长串的值。我们建议使用星号(*)通配符代替所有选择如果你想查询的所有有价值的度量某一维度的名字。

使用多值模板变量只支持维值。使用多值模板变量地区,名称空间,或指标名称不支持。

指标的数学表达式

您可以创建新的时间序列指标通过操作使用数学函数最重要的监测指标。算术运算符、一元减法和其他功能是支持的,可以应用于监测指标。更多细节可以找到可用的函数AWS度量的数学

作为一个例子,如果你想应用算术运算度量,你可以通过给一个id(一个独一无二的字符串)的原始指标如下所示。然后,您可以使用这个id和算术运算应用于表达领域的新指标。

请注意,在您使用表达式字段引用另一个查询,queryA * 2,它将不可能创建一个警告规则根据查询。

深度链接从Grafana板监测控制台
CloudWatch深度链接
CloudWatch深度链接

左点击一个时间序列的面板显示链接的上下文菜单在监测控制台视图。单击该链接将打开一个新标签,将带你到监测控制台和显示所有的指标查询。如果你不是目前监测控制台登录,登录页面会转发你的链接。任何账户所提供的链接是有效的但只会显示正确的指标如果你登录账户在Grafana对应于所选择的数据源。

此功能不可用的指标是基于指标的数学表达式。

使用度量查询选项

注意:这个查询选项仅在Grafana 8.3及更高版本可用。

度量查询监测的插件是什么被称为规的见解在AWS控制台。这是一个快速、灵活的、基于sql的查询引擎,使您能够识别趋势和模式在数以百万计的实时操作指标。它使用一个SQL方言。查询语法如下所示。

从名称空间|模式选择功能(MetricName) (…), labelKey运营商labelValue [|…GROUP BY labelKey]] [[,……]](ORDER BY()函数(DESC | ASC]](限制数量)

下表提供了基本的解释查询关键字。有关指标的见解语法的细节,请参考AWS的文档

关键字 描述
函数 必需的。指定要使用的聚合函数,还指定了指标的名称查询。有效值是AVG,计数,最大值、最小值、总和
MetricName 必需的。例如,CPUUtilization
必需的。指定指标的来源。您可以指定包含度量指标名称空间查询,或模式表函数。一些命名空间的例子是1AWS / EC2,AWS /λ
模式 可选的。可以缩小查询结果只精确匹配的指标或指标,纳比赛。
在哪里 可选的。过滤结果只有那些指标,匹配您的指定的表达式。例如,InstanceType ! = ' c3.4xlarge '
集团 可选的。组查询结果为多个时间序列。例如,组的名
命令 可选的。指定返回的时间序列的顺序。选项是ASC,DESC
限制 可选的。返回的时间序列数的限制。

限制的信息度量的见解,请参考AWS的文档

建造者模式

在建造者模式:创建一个查询

  1. 浏览并选择一个度量名称空间、指标名称、过滤器、集团和秩序从上面的表中选择使用信息。
  2. 对于每一个选项,选择从列表中可能的选项。

Grafana自动构造SQL查询根据你的选择。

代码模式

在代码中创建一个查询模式:

  1. 写下你的SQL查询。
  2. 运行查询,单击运行查询上面的代码编辑器。

代码编辑器有一个内置的自动完成功能,建议关键词,聚合,名称空间、指标、标签和标签值。当达到空间显示的建议,逗号或元字符。您还可以使用CTRL + Space键盘组合。

代码编辑器自动完成

注意:在代码编辑器中使用的模板变量可能干扰自动完成。

常见的度量查询编辑字段

在度量查询编辑器的底部,你会发现三个字段,是常见的度量搜索度量查询

Id

GetMetricData API要求所有的查询都有一个惟一的ID。使用这个字段指定一个ID。ID可以包括数字、字母和下划线,必须以小写字母开始。如果没有指定ID, grafana将生成一个ID使用以下模式查询(refId当前查询的行),如queryA第一行查询面板编辑器。

ID可用于参考查询指标的数学表达式。

一段时间内的长度是与一个特定的亚马逊监测统计。时期定义在数秒钟,有效值周期是1、5、10、30或60的倍数。

如果字段留空或设置汽车,然后根据时间范围和自动计算cloudwatch保留政策。使用的公式是在2000秒/时间范围,然后拍下一个更高的价值在一组预定义的时期(60、300、900、3600、21600、86400]基于保留删除后时期。通过点击显示查询预览在查询编辑器中,你可以看到什么时期Grafana使用。

标签

标签字段允许您覆盖默认度量传奇使用监测动态标签的名称。如果您正在使用一个基于时间的动态标签等$ {MIN_MAX_TIME_RANGE}传说,那么价值来源于当前时区时间范围选择器中指定。的完整列表标签模式和动态标签限制,请参考CloudWatch动态标签文档。

弃用别名模式:在Grafana 9中,动态标签已经取代了别名的模式监测数据源。任何现有的别名模式将会迁移到一个相应的动态标签模式。如果你想使用别名模式而不是动态标签,设置功能切换cloudWatchDynamicLabels在Grafana配置文件。它将恢复到别名模式系统,使用前面的别名格式的逻辑。

别名字段将被弃用和删除。在这个过渡时期,我们无法解决别名模式系统相关的bug。为什么我们做这个变化的详细信息,请参考发行48434

使用日志查询编辑器

查询监测日志:

  1. 选择地区和20你想查询日志组。
  2. 使用的主要输入区域来编写查询CloudWatch日志查询语言

您还可以编写查询返回时间序列数据使用统计数据命令。在做统计数据查询在探索中,你必须确保你是在指标探索模式。

探索模式切换器
探索模式切换器

深度链接从Grafana板监测控制台

CloudWatch日志深度链接
CloudWatch日志深度链接
如果你想查看监测日志中查询见解控制台,单击CloudWatch日志的见解旁边的按钮查询编辑器。如果你不是目前监测控制台登录,登录页面会转发你的链接。任何账户所提供的链接是有效的但只会显示正确的指标如果你登录账户在Grafana对应于所选择的数据源。

报警

提醒需要查询返回数值数据,监测日志支持。例如通过使用统计数据支持命令,警报。例如,这是一个有效的查询报警信息,包括文本“异常”:

过滤器@message像/异常/ |统计count(*)由本(1 h) | exceptionCount exceptionCount desc排序

请注意查询:当试图警告,如果一个错误输入数据必须是一个宽系列但有…收到,确保你的查询返回有效的数字数据可以打印在一个时间序列面板。

有关Grafana警报的更多信息,请参考报警文档。

CloudWatch配置grafana.ini

的Grafana配置文件包含一个AWS部分,你可以自定义数据源。

配置选项 描述
allowed_auth_providers 指定允许哪些身份验证提供者的监测数据源。以下供应商在OSS Grafana默认启用:默认的AWS SDK(默认)、钥匙(访问和秘密密钥),证书(证书文件),ec2_IAM_role (EC2我的角色)。
assume_role_enabled 允许您禁用假设角色(攻击)在监测数据来源。默认情况下,假设为OSS Grafana启用角色(攻击)。
list_metrics_page_limit 当一个自定义查询中指定的名称空间是编辑,度量API列表用于填充指标场和字段。API是分页并返回到每页500个结果。CloudWatch数据源也限制了500的页面数。然而,你可以改变这种限制使用list_metrics_page_limit变量grafana配置文件

定价

亚马逊Grafana监测数据源使用ListMetricsGetMetricDataCloudWatch API调用列表和检索度量。CloudWatch日志的定价是基于的数据量摄取,归档,通过监测和分析日志查询的见解。每次你在查询编辑器中选择一个尺寸Grafana将出具ListMetrics请求。一旦你想要改变查询的查询编辑器,一个新的请求GetMetricData将发布。

Grafana版本6.5或更高版本,所有API请求GetMetricStatistics被替换为调用GetMetricData为监测指标数学和提供更好的支持允许使用通配符时自动生成的搜索表达式或禁用匹配精确选择。虽然GetMetricStatistics胜任CloudWatch API层自由,这不是GetMetricData调用。

有关更多信息,请参考CloudWatch定价页

服务配额

AWS定义配额,或限制,对资源、行动和项目AWS帐户。根据仪表板的查询和用户访问指示板的数量,你可以达到对各种监测和监测记录资源使用限制。注意配额定义每账户和地区。如果您使用多个区域或设立了多个监测数据源查询多个账户,你需要为每个帐户请求增加配额和每个地区限制。

请求一个配额增加,参观AWS服务配额控制台。有关更多信息,请参阅AWS文档服务配额CloudWatch限制