Kubernetes监控

可视化和警报Kubernetes集群在几分钟内,而不是几天。

为什么使用Kubernetes Grafana云监控吗

时间的价值

减少部署、安装和故障排除时间与这个现成的监控工具,只需要运行几个CLI命令,或添加一些小更改执掌图表。

快确定根本原因

向下通过与集群基础设施导航视图识别并解决问题,没有不同的窗口之间切换的麻烦和监测工具。

简单的规模

开发商第一通过设计,应用程序的简单直观的工作流程使得新员工培训新老和团队。

Kubernetes监测Grafana云:起步

2点
集群导航视图

下钻Kubernetes集群Kubernetes吊舱

快速移动整个Kubernetes设置在一个UI。只需要点击几下,开始与一个集群视图和钻一直到特定Kubernetes吊舱。

  • 高级监控提供基础设施的可见性。
  • 彩色视觉健康和图标导致更快的问题识别和解决。
集群导航
节点可观测性
节点可观测性

理解你的节点

获得一个鸟瞰健康,利用和配置节点。

  • 发现在一个集群中所有节点,他们的条件,pod密度。
  • 颜色指标指导节点资源管理。
  • 看到里面一个节点指示吊舱的健康有关。
指标和警报

固执己见的指标和警报

访问Kube-state-metrics和报警规则需要有效地监控Kubernetes集群。

  • 策划的一组指标,以避免基数爆炸
  • 社区的建设提醒标准
指标和警报
k8代理日志
豆荚日志

即时Prometheus-correlated日志

普罗米修斯和Grafana洛基的共享的元数据Kubernetes集群保持相同的标签,所以访问相关Kubernetes指标和日志并不简单。

预先构建的仪表盘

预配置的仪表盘

Kubernetes监测Grafana云提供了开箱即用的仪表板覆盖Kubernetes集群和他们的工作负载。这些仪表盘监控:

  • 资源使用情况
  • 集群操作
监视仪表板

很容易开始

全面实施细节和最佳实践

1

报名

创建您的免费Grafana云账户

2

连接你的数据

几次点击,为预先构建的仪表板和报警设置默认配置规则。

3

部署

数据将从集群流到Grafana云。

Kubernetes监控集成Grafana云上使我们的工程师有本地监控。不再做他们不得不伸出我们的团队行为。相反,他们只是Grafana云集成选项卡上单击一个按钮,导航到开箱即用的仪表板,和看到所有的信息——CPU使用率、日志、指标——他们需要自己解决问题。它是如此简单,快速帮助我们发现问题,节约了我们大量的定制开发的时间。
詹姆斯Wojewoda
导致网站可靠性工程师

Kubernetes指标和报警规则

Grafana Kubernetes监控解决方案的云吞下一组默认度量在60秒刮区间。报警规则的设置有助于建立和运行警报为集群和他们的工作负载。

阅读更多关于Kubernetes指标报警规则

关键指标包括

*可滚动
KubeNodeNotReady
KubeNodeUnreachable
KubeletTooManyPods
KubeNodeReadinessFlapping
KubeletPlegDurationHigh
KubeletPodStartUpLatencyHigh
KubeletClientCertificateExpiration
KubeletServerCertificateExpiration
KubeletClientCertificateRenewalErrors
KubeletServerCertificateRenewalErrors
KubeletDown
KubeVersionMismatch
KubeClientErrors
KubeCPUOvercommit
KubeMemoryOvercommit
KubeCPUQuotaOvercommit
KubeMemoryQuotaOvercommit
KubeQuotaAlmostFull
KubeQuotaFullyUsed
KubeQuotaExceeded
CPUThrottlingHigh
KubePodCrashLooping
KubePodNotRead
KubeDeploymentGenerationMismatch
KubeDeploymentReplicasMismatch
KubeStatefulSetReplicasMismatch
KubeStatefulSetGenerationMismatch
KubeStatefulSetUpdateNotRolledOut
KubeDaemonSetRolloutStuck
KubeContainerWaiting
KubeDaemonSetNotScheduled
KubeDaemonSetMisScheduled
KubeJobCompletion
KubeJobFailed
KubeHpaReplicasMismatch
KubeHpaMaxedOut

关键报警规则包括

*可滚动
集群:名称空间:pod_cpu:活跃:kube_pod_container_resource_limits
集群:名称空间:pod_cpu:活跃:kube_pod_container_resource_requests
集群:名称空间:pod_memory:活跃:kube_pod_container_resource_limits
集群:名称空间:pod_memory:活跃:kube_pod_container_resource_requests
container_cpu_cfs_periods_total
container_cpu_cfs_throttled_periods_total
container_cpu_usage_seconds_total
container_fs_reads_bytes_total
container_fs_reads_total
container_fs_writes_bytes_total
container_fs_writes_total
container_memory_cache
container_memory_rss
container_memory_swap
container_memory_working_set_bytes
container_network_receive_bytes_total
container_network_receive_packets_dropped_total
container_network_receive_packets_total
container_network_transmit_bytes_total
container_network_transmit_packets_dropped_total
container_network_transmit_packets_total
go_goroutines
kube_daemonset_status_current_number_scheduled
kube_daemonset_status_desired_number_scheduled
kube_daemonset_status_number_available
kube_daemonset_status_number_misscheduled
kube_daemonset_updated_number_scheduled
kube_deployment_metadata_generation
kube_deployment_spec_replicas
kube_deployment_status_observed_generation
kube_deployment_status_replicas_available
kube_deployment_status_replicas_updated
kube_horizontalpodautoscaler_spec_max_replicas
kube_horizontalpodautoscaler_spec_min_replicas
kube_horizontalpodautoscaler_status_current_replicas
kube_horizontalpodautoscaler_status_desired_replicas
kube_job_failed
kube_job_spec_completions
kube_job_status_succeeded
kube_namespace_created
kube_node_info
kube_node_spec_taint
kube_node_status_allocatable
kube_node_status_capacity
kube_node_status_condition
kube_pod_container_resource_limits
kube_pod_container_resource_requests
kube_pod_container_status_waiting_reason
kube_pod_info
kube_pod_owner
kube_pod_status_phase
kube_replicaset_owner
kube_resourcequota
kube_statefulset_metadata_generation
kube_statefulset_replicas
kube_statefulset_status_current_revision
kube_statefulset_status_observed_generation
kube_statefulset_status_replicas
kube_statefulset_status_replicas_ready
kube_statefulset_status_replicas_updated
kube_statefulset_status_update_revision
kubelet_certificate_manager_client_expiration_renew_errors
kubelet_certificate_manager_client_ttl_seconds
kubelet_certificate_manager_server_ttl_seconds
kubelet_cgroup_manager_duration_seconds_bucket
kubelet_cgroup_manager_duration_seconds_count
kubelet_node_config_error
kubelet_node_name
kubelet_pleg_relist_duration_seconds_bucket
kubelet_pleg_relist_duration_seconds_count
kubelet_pleg_relist_interval_seconds_bucket
kubelet_pod_start_duration_seconds_count
kubelet_pod_worker_duration_seconds_bucket
kubelet_pod_worker_duration_seconds_count
kubelet_running_container_count
kubelet_running_containers
kubelet_running_pod_count
kubelet_running_pods
kubelet_runtime_operations_duration_seconds_bucket
kubelet_runtime_operations_errors_total
kubelet_runtime_operations_total
kubelet_server_expiration_renew_errors
kubelet_volume_stats_available_bytes
kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_inodes
kubelet_volume_stats_inodes_used
kubernetes_build_info
machine_memory_bytes
namespace_cpu: kube_pod_container_resource_limits:和
namespace_cpu: kube_pod_container_resource_requests:和
namespace_memory: kube_pod_container_resource_limits:和
namespace_memory: kube_pod_container_resource_requests:和
namespace_workload_pod
namespace_workload_pod: kube_pod_owner:标出
node_namespace_pod_container: container_cpu_usage_seconds_total: sum_irate
node_namespace_pod_container: container_memory_cache
node_namespace_pod_container: container_memory_rss
node_namespace_pod_container: container_memory_swap
node_namespace_pod_container: container_memory_working_set_bytes
node_quantile: kubelet_pleg_relist_duration_seconds: histogram_quantile
process_cpu_seconds_total
process_resident_memory_bytes
rest_client_request_duration_seconds_bucket
rest_client_requests_total
storage_operation_duration_seconds_bucket
storage_operation_duration_seconds_count
storage_operation_errors_total
向上
volume_manager_total_volumes

准备好开始Kubernetes监控吗?

使用Kubernetes监控,你有三个选择Grafana云。所有计划和预先构建的仪表板+度量和报警规则。

云自由

bob体育手机二维码

3活跃用户

10 k指标,50 gb的日志,50 gb的痕迹

功能包括:

  • 14天保留
  • Grafana OnCall
  • Grafana事件
  • 综合监测
  • Grafana报警

云亲

8美元/ mo +使用

包括所有的功能在自由,再加上:

  • 保留:13个月指标;30天的日志和跟踪
  • Grafana机器学习
  • SSO / SAML / LDAP
  • 数据源的权限
  • 云SLA和支持
  • 查询缓存
  • 报告和出口
  • 企业可选的附加插件

云先进

定制的价格

包括所有功能支持,再加上:

  • 定制的保留
  • 访问所有企业插件
  • 审计日志记录
  • 增强的LDAP
  • 团队同步
  • 自定义品牌
  • 专用技术帐户管理
  • 基于角色的访问控制