Grafana Cloud的Linux节点集成

Grafana Cloud的Linux Node集成使您能够收集与节点上运行的操作系统相关的指标,包括CPU使用情况、平均负载、内存使用情况、磁盘和网络I/O等方面。它还允许您使用代理刮日志与promtail。此集成包括有用的警报和两个预先构建的仪表板,以帮助您监视和可视化这些指标和日志。

有关与Linux Node集成度量的更多信息,请参见使用Linux主机集成监视Linux主机通过Grafana Agent从Linux主机收集日志

在开始之前

支持文件:

  • syslog
  • kern.log
  • 的日志

您需要将Grafana代理用户添加为您打算从中收集的任何日志位置的所有者。例如,将用户grafana-agent添加到/var/syslog所属的adm组中,执行如下命令:

sudo usermod -a -G adm grafana-agent

注意:组名取决于您的Linux发行版和日志位置,在添加Grafana Agent为所有者之前,请验证您的系统组名。

为Grafana Cloud安装Linux节点集成

  1. 在您的Grafana Cloud实例中,单击集成和连接(闪电图标),然后搜索或导航到Linux服务器瓷砖。
  2. 单击Linux Server瓷砖,然后单击安装集成
  3. 安装集成之后,按照配置细节页面设置Grafana代理自动抓取和发送Linux服务器指标到您的Grafana云实例。

配置抓取作业(或类似的指标收集术语)

要在同一个仪表板上查看相关的日志和指标信号,必须进行验证工作实例标签匹配node_exporter集成配置指标,及以下日志.的工作标签应设置为集成/ node_exporter.代理在默认情况下为度量设置了该参数,因此您只需要为日志刮擦指定该参数。

代理有三个配置选项来抓取您的日志。如果需要查看systemd和OS (/var/log文件)日志,请使用抓取systemd和OS日志配置。

刮取系统日志

此配置提供了一组预定义的标签,用于预构建的Linux Server仪表板。这允许您使用systemd Unit下拉过滤器过滤特定的systemd应用程序日志。

集成:node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_journal_scrapal_刮日志:max_age: 24h labels: instance: hostname job: Integrations /node_export relabel_configs:—source_labels: ['__journal__systemd_unit'] target_label: 'unit' - source_labels: ['__journal__boot_id'] target_label: 'boot_id' - source_labels:['__journal__transport'] target_label: 'transport'

直接抓取日志文件

通过该配置,可以直接刮取日志文件。如果systemd日志配置不是一个选项,请使用此配置。

Integrations: node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_direct_scraping static_configs:—targets:—localhost labels: instance: hostname __path__: /var/log/{syslog,messages,auth.log,secure,kern.log} job: Integrations /node_export .log

通过此配置,可以同时查看systemd和OS (/var/log文件)的日志。使用此配置可以直接抓取systemd日志和日志文件。

Integrations: node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_direct_scraping static_configs:—targets:—localhost labels: instance: hostname __path__: /var/log/{syslog,messages,*.log} job: Integrations /node_export - job_name: Integrations / node_exporter_journal_scraping journal: max_age: 24h labels: instance: hostname job:集成/ node_exporters relabel_configs: - source_labels: ['__journal__systemd_unit'] target_label: 'unit' - source_labels: ['__journal__boot_id'] target_label: 'boot_id' - source_labels: ['__journal__transport'] target_label: 'transport'

指示板

在成功配置Linux Node集成之后,将在Grafana Cloud实例中安装两个预构建的仪表板,以帮助您监视Linux Node指标和日志。

节点指示板

此指示板提供有关特定节点的信息,包括CPU使用情况、平均负载、内存使用情况和磁盘空间使用情况。

Linux节点仪表板

USE方法仪表板

该仪表板基于USE方法开发,重点关注资源利用率、饱和度和错误。它提供了由Grafana Agent收集的日志统计信息,以帮助您分析操作系统的性能。

Linux USE方法仪表板

配置警报

该集成在警告和关键级别之间提供了16个警报:

警报 描述
NodeFilesystemAlmostOutOfSpace 警告:文件系统剩余空间小于5%
NodeFilesystemAlmostOutOfSpace 紧急:文件系统剩余空间小于3%
NodeFilesystemFilesFillingUp 警告:文件系统预计将在未来24小时内耗尽inode
NodeFilesystemFilesFillingUp 紧急:文件系统预计将在未来4小时内耗尽inode
NodeFilesystemAlmostOutOfFiles 警告:文件系统剩余的inode少于5%。
NodeFilesystemAlmostOutOfFiles 紧急:文件系统剩余的inode少于3%。
NodeNetworkReceiveErrs 警告:网络接口正在报告许多接收错误
NodeNetworkTransmitErrs 警告:网络接口报告许多传输错误
NodeHighNumberConntrackEntriesUsed 警告:连接轨道数量已接近极限
NodeTextFileCollectorScrapeError 警告:节点导出器文本文件收集器刮除失败
NodeClockSkewDetected 警告:检测到时钟倾斜
NodeClockNotSynchronising 警告:时钟未同步
NodeRAIDDegraded 紧急:RAID降级
NodeRAIDDiskFailure 警告:RAID阵列中的设备失效
NodeFileDescriptorLimit 警告:预计内核很快就会耗尽文件描述符限制
NodeFileDescriptorLimit 关键:内核预计很快就会耗尽文件描述符限制

由Grafana Cloud的Linux Node集成捕获的服务和指标

要查看此集成提取的指标列表,请参阅普罗米修斯米蒂克斯文件

成本

通过将您的Linux服务器连接到Grafana Cloud,您可能会产生费用。欲了解更多信息,请使用以下链接:

有关增加您的Grafana Cloud帐户用于每个云层中包含的指标的活动系列数量,请参见主动系列和dpm的使用云层定价