博客/社区

如何提高正常运行时间的实时监控,Grafana仪表板,以及Grafana洛基:盘内部网络的可观测性栈

2022年7月21日 4分钟

菜网络的使命是连接人与物通过改变世界沟通的方式。产品从盘和bob手机app官网吊索电视零售无线服务和5 g网络,监控他们的卫星通讯设备是关键任务保持极端的正常运行时间菜的全美2000万个客户。

在2022年他们GrafanaCONline演讲题为“Grafana和Grafana洛基在空间:监测地球站操作盘网络”(可观看对需求),系统管理员工程师Ted雷蒙德共享他的团队如何使用Grafana改善已经杰出的正常运行时间的实时仪表板和见解,从上行设备性能的天气条件。

增加正常运行时间与自动监控和警报

雷蒙德的地球站运营团队维护地面段菜网络的卫星通信:天线,天线控制,发射机,上下转换器。他们还与全国的团队成员紧密合作,确保区域和国家电视内容仍在空气中。

虽然团队已经交付99%正常运行时间作为他们的努力的一部分,雷蒙德想接近1%的差距,得到更好的实时视图的健康和他们的设备的性能。

实施之前Grafana仪表板、数据收集和同一父本分析效率低下和手册。“这花了很长时间收集的数据,提出了一种对组织内的普通用户有意义,”雷蒙德说。此外,只有专业人员才能访问这个数据和分享,所以合作团队经常花了几天或几周。

雷蒙德的团队快速设置Grafana和配置Grafana报警火只要设备性能成为了一个问题——例如,如果天线或信号电平不会议需求。对于这些警报,团队可以解决问题之前就成为一个主要中断正常运行时间。“我们设置(Grafana)在我们的一个控制室,它与一个数据库。那一天,我们已经查询数据库和构建仪表盘面板然后图表,”雷蒙德说。

* Grafana仪表盘给菜网络地球站操作团队成员详细,天线运动的实时视图,这样他们就可以捕获性能问题之前,影响正常运行时间。*
Grafana仪表盘给菜网络地球站操作团队成员详细,天线运动的实时视图,这样他们就可以捕获性能问题之前,影响正常运行时间。

现在他们有Grafana喂它们的实时数据,从卫星天线运动和发射机状态性能。使用阈值在每个仪表板和Grafana警报,团队能够赶上HDD消费问题和天线操作更有效率。

他们还扩大了可观测性堆栈包括Grafana洛基阅读日志文件等调试文件从服务器软件和VAR日志消息的健康。研究小组还利用洛基读取日志文件服务器收集SNMP陷阱和Grafana提取数据并建立图表和警报围绕这些日志文件。

”而不是想知道某件事发生时,我们可以使用Grafana发出一个警告说,在这个时间点这个设备发送SNMP陷阱,”雷蒙德说。“故障发生时的猜测。”

更好的是,任何人都可以建立仪表板和解释数据:“没有真正的编程背景的用户可以走进Grafana和定制仪表板轻松,”雷蒙德说。

现代化的监测和建设能够Grafana仪表板

团队扩大他们的用例监控内部服务器的健康和性能,在上行站点外部天气条件,甚至是一个特定的任务,团队共同努力脱离轨道航天器。

“Pre-Grafana工作的使命,就像需要电话,电子邮件,和协调数据收集。Grafana,我们可以把所有必要的服务器和天线和建立一个仪表板在15分钟内监控航天器的运动,”雷蒙德说。

*这道菜网络地球站操作代替手工数据收集和电话监控卫星位置的实时Grafana仪表板,条件和时间在一个协作任务脱离轨道的航天器。*
这道菜网络地球站操作代替手工数据收集和电话监控卫星位置的实时Grafana仪表板,条件和时间在一个协作任务脱离轨道的航天器。

“在过去,我们一次趋势数据从一个数据库和运行报告表格。Grafana,我们可以查询所有60监视和控制系统同时有数据出现在现场,”雷蒙德说,他还指出,不仅Grafana美国菜网络的数据。“工作在这个现代化的目标,创造效率在团队中给我们带来了更紧密的联系在一起了。”

看完整的会话更多地了解菜网络的系统架构,看看他们种植Grafana操作整个公司。我们所有的会话从GrafanaCONline 2022现在可以在需求。