Grafana Cloud的Linux节点集成
Grafana Cloud的Linux Node集成使您能够收集与节点上运行的操作系统相关的指标,包括CPU使用情况、平均负载、内存使用情况、磁盘和网络I/O等方面。它还允许您使用代理刮日志与promtail。此集成包括有用的警报和两个预先构建的仪表板,以帮助您监视和可视化这些指标和日志。
有关与Linux Node集成度量的更多信息,请参见使用Linux主机集成监视Linux主机和通过Grafana Agent从Linux主机收集日志.
在开始之前
支持文件:
- syslog
- kern.log
- 的日志
您需要将Grafana代理用户添加为您打算从中收集的任何日志位置的所有者。例如,将用户grafana-agent添加到/var/syslog所属的adm组中,执行如下命令:
sudo usermod -a -G adm grafana-agent
注意:组名取决于您的Linux发行版和日志位置,在添加Grafana Agent为所有者之前,请验证您的系统组名。
为Grafana Cloud安装Linux节点集成
- 在您的Grafana Cloud实例中,单击集成和连接(闪电图标),然后搜索或导航到Linux服务器瓷砖。
- 单击Linux Server瓷砖,然后单击安装集成.
- 安装集成之后,按照配置细节页面设置Grafana代理自动抓取和发送Linux服务器指标到您的Grafana云实例。
配置抓取作业(或类似的指标收集术语)
要在同一个仪表板上查看相关的日志和指标信号,必须进行验证工作
和实例
标签匹配node_exporter
集成配置指标
,及以下日志
.的工作
标签应设置为集成/ node_exporter
.代理在默认情况下为度量设置了该参数,因此您只需要为日志刮擦指定该参数。
代理有三个配置选项来抓取您的日志。如果需要查看systemd和OS (/var/log文件)日志,请使用抓取systemd和OS日志配置。
刮取系统日志
此配置提供了一组预定义的标签,用于预构建的Linux Server仪表板。这允许您使用systemd Unit下拉过滤器过滤特定的systemd应用程序日志。
集成:node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_journal_scrapal_刮日志:max_age: 24h labels: instance: hostname job: Integrations /node_export relabel_configs:—source_labels: ['__journal__systemd_unit'] target_label: 'unit' - source_labels: ['__journal__boot_id'] target_label: 'boot_id' - source_labels:['__journal__transport'] target_label: 'transport'
直接抓取日志文件
通过该配置,可以直接刮取日志文件。如果systemd日志配置不是一个选项,请使用此配置。
Integrations: node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_direct_scraping static_configs:—targets:—localhost labels: instance: hostname __path__: /var/log/{syslog,messages,auth.log,secure,kern.log} job: Integrations /node_export .log
抓取systemd和OS日志(推荐)
通过此配置,可以同时查看systemd和OS (/var/log文件)的日志。使用此配置可以直接抓取systemd日志和日志文件。
Integrations: node_export: enabled: true relabel_configs:—replacement: hostname source_labels:—__address__ target_label:实例日志:configs:—name: Integrations scrape_configs:—job_name: Integrations / node_exporter_direct_scraping static_configs:—targets:—localhost labels: instance: hostname __path__: /var/log/{syslog,messages,*.log} job: Integrations /node_export - job_name: Integrations / node_exporter_journal_scraping journal: max_age: 24h labels: instance: hostname job:集成/ node_exporters relabel_configs: - source_labels: ['__journal__systemd_unit'] target_label: 'unit' - source_labels: ['__journal__boot_id'] target_label: 'boot_id' - source_labels: ['__journal__transport'] target_label: 'transport'
指示板
在成功配置Linux Node集成之后,将在Grafana Cloud实例中安装两个预构建的仪表板,以帮助您监视Linux Node指标和日志。
节点指示板
此指示板提供有关特定节点的信息,包括CPU使用情况、平均负载、内存使用情况和磁盘空间使用情况。
USE方法仪表板
该仪表板基于USE方法开发,重点关注资源利用率、饱和度和错误。它提供了由Grafana Agent收集的日志统计信息,以帮助您分析操作系统的性能。
配置警报
该集成在警告和关键级别之间提供了16个警报:
警报 | 描述 |
---|---|
NodeFilesystemAlmostOutOfSpace | 警告:文件系统剩余空间小于5% |
NodeFilesystemAlmostOutOfSpace | 紧急:文件系统剩余空间小于3% |
NodeFilesystemFilesFillingUp | 警告:文件系统预计将在未来24小时内耗尽inode |
NodeFilesystemFilesFillingUp | 紧急:文件系统预计将在未来4小时内耗尽inode |
NodeFilesystemAlmostOutOfFiles | 警告:文件系统剩余的inode少于5%。 |
NodeFilesystemAlmostOutOfFiles | 紧急:文件系统剩余的inode少于3%。 |
NodeNetworkReceiveErrs | 警告:网络接口正在报告许多接收错误 |
NodeNetworkTransmitErrs | 警告:网络接口报告许多传输错误 |
NodeHighNumberConntrackEntriesUsed | 警告:连接轨道数量已接近极限 |
NodeTextFileCollectorScrapeError | 警告:节点导出器文本文件收集器刮除失败 |
NodeClockSkewDetected | 警告:检测到时钟倾斜 |
NodeClockNotSynchronising | 警告:时钟未同步 |
NodeRAIDDegraded | 紧急:RAID降级 |
NodeRAIDDiskFailure | 警告:RAID阵列中的设备失效 |
NodeFileDescriptorLimit | 警告:预计内核很快就会耗尽文件描述符限制 |
NodeFileDescriptorLimit | 关键:内核预计很快就会耗尽文件描述符限制 |
由Grafana Cloud的Linux Node集成捕获的服务和指标
要查看此集成提取的指标列表,请参阅普罗米修斯米蒂克斯文件.
成本
通过将您的Linux服务器连接到Grafana Cloud,您可能会产生费用。欲了解更多信息,请使用以下链接:
有关增加您的Grafana Cloud帐户用于每个云层中包含的指标的活动系列数量,请参见主动系列和dpm的使用和云层定价.
相关的Grafana云资源
《普罗米修斯》和《格拉夫纳云》简介
普罗米修斯要接管监控世界了!在本次网络研讨会中,我们将首先快速介绍开源项目,它是监控现代云原生系统的事实上标准。
如何用Grafana Cloud建立和可视化大规模的合成监控
学习如何使用Kubernetes, Grafana Loki和Grafana Cloud的合成监控功能来设置您的基础设施的检查。
使用Grafana Cloud来提高制造工厂的效率
本节GrafanaCONline将讲述Grafana如何帮助一家拥有75年历史的制造公司提高产品质量和设备维护。