成功/ Blinkit

从ELK到Grafana Loki:电子商务领导者Blinkit如何用Grafana Cloud现代化他们的日志堆栈

Blinkit原名Grofers,是一家为印度各地数百万消费者提供食品杂货和生活必需品的即时快递公司。顾客可以使用移动应用程序在路上下单Blinkit拥有2000多名员工和遍布全国的仓库,以确保所有的发货在10分钟或更短的时间内完成。

随着公司规模的扩大,开始向全国范围内越来越多的地点和消费者提供即时传送服务,Blinkit的传统日志工具变得过于昂贵和繁琐,难以管理。开发人员最终花费了大量的精力来维护一个自我管理的Elastic Stack,没有留下任何空间来专注于为他们的客户改进产品和服务。bob手机app官网

Blinkit工程经理Vaibhav Krishna说:“我们花了一半的时间来确保ELK栈的所有东西都正常运行,并不断调整我们的日志,以确保不会崩溃。”

加入购物车:Grafana Loki

作为回应,该公司放弃了Elastic,采用了一种新的日志解决方案—Grafana洛基.该交付服务已经利用了一些开源软件,比如用于仪表盘的Grafana和Prometheus,该软件在AWS上的Kubernetes环境中每月传输约150万个数据。随着Grafana Loki加入到他们的堆栈中,Blinkit现在将所有的应用程序日志输入到他们的Loki实例中,每个月总计可达60TB的日志数据。

“Grafana Loki是我们新的日志聚合系统,它存储并允许我们查询来自所有应用程序和整个基础设施的日志,”Krishna说。“它非常适合我们的生态系统。”

尽管团队从一个自托管的Loki实例开始,但他们很快意识到,他们不想重复以前的错误,不想把资源花在维护产品上,而不是创新新产品。因此,除了在遗留系统上使用InfluxDB和AWS CloudWatch之外,他们迅速迁移到托管了Grafana云日志服务现在,Blinkit可以在一个地方无缝地集成他们的指标和日志,并以新的、有影响力的方式使用全面的数据。

克里希纳表示:“在Loki和Grafana之间,你可以从一个地方获取日志和指标。“在某些情况下,Loki是关键的监控工具,我们已经开始依赖Loki作为我们的主要指标来源之一,就像我们依赖Prometheus一样。”

Blinkit&rsquo的内部Grafana主页

上图是Blinkit的内部Grafana主页,其中有定制的数据面板,展示了关键的生产和应用数据。

总的来说,Blinkit通过它的Grafana Stack来监视应用程序和基础设施数据源。在Grafana中可视化的一个关键数据源是每分钟的客户结帐,因为它与客户满意度和忠诚度指标直接相关。现在他们已经从ELK堆栈转移到Grafana云,Blinkit团队不再错过实时观察整个可观察性图像所需的关键数据。Blinkit团队可以在消费者屈服于在线结账过程中的小问题之前迅速解决问题,减少他们放弃购物车的愿望,并减少相关的收入损失。

Grafana帮助我们确保我们的结帐总是为客户工作。如果我们没有一个有效的结账系统,我们就没有一个电子商务平台。

Vaibhav Krishna, Blinkit工程经理

"你建造它,你维护它"

超过200名Blinkit工程师在“你构建它,你维护它”的理念下,以某种形式使用Grafana进行可视化。

对于Blinkit的工程师开发的每一个新产品,他们还建立了自己的Grafana仪表板来监控其性能,依赖于开箱即用的面板和Grafana上现成的面板社区仪表板目录

“每次我们得到一个新工具,我们都会使用来自社区的Grafana面板来监控它,”克里希纳说。

如果团队中有任何问题,格拉夫纳实验室就会介入。bob电竞频道除了每月与技术客户经理的会议外,Blinkit还受益于每月的工程会议,他们可以直接接触Loki的维护者,这是他们企业级支持服务的一部分。克里希纳说:“我们可以向他们询问一些非常基本的问题,我们会得到答复。”他还说,Loki团队帮助他们建立了一些早期的Grafana仪表板。“我们也得到了即将推出产品的预览,他们也在积极寻求反馈。”

Blinkit工程师还从Grafana开源社区中学到了很多东西,后者总是愿意帮助解决从简单到复杂的问题。

克里希纳说:“Grafana的开源组件非常激励我们。”“我们喜欢与社区互动。很容易看出,Grafana为建立和维护一个充满活力的社区付出了很多努力。我认为这很酷。”

他们也相信回报。Blinkit是一个开源工具,传说,帮助构建和管理带有预填充指标和警报的Grafana仪表板。Legend允许Blinkit工程师自动设置Grafana仪表板,而无需手动编写CloudWatch、Prometheus或InfluxDB查询。最重要的是,Legend使用USE和RED方法来监视服务和基础设施级别的度量。(关于该工具的更多信息,请查看克里希纳最近的文章ObservabilityCON点播讲座)

克里希纳表示:“我们希望朝着创建自动化仪表盘的方向前进。”

Blinkit和Grafana的未来

随着Blinkit价值10亿美元的业务继续扩大,克里希纳希望他的团队的仪表盘技能能够反映出他们的数据源和系统日益增长的数量和复杂性。

所有的可视化选项克里希纳说:“我想改进我们的面板,从线形图和柱状图到热图和其他面板,以更好地可视化我们正在关注的一些指标。”“我们还没有大规模采用所有不同的选择。”

他还希望在Grafana Stack中添加分布式跟踪和即将出现的Grafana Tempo,并研究用Grafana警报和监视sla和slo。

Blinkit对Grafana Cloud的未来感到兴奋,我们将继续拥抱Grafana Cloud,因为我们将继续扩大规模,保持印度领先的即时交付平台。

Vaibhav Krishna, Blinkit工程经理。

因此,无论他们的客户住在哪里,克里希纳都相信Blinkit将始终兑现他们的快速服务承诺。克里希纳说:“因为有了Grafana,我们才能更快地发展。”

Grafana云是开始使用度量、日志、跟踪和仪表板的最简单方法。我们对每个用例都有一个慷慨的免费永久层bob体育手机二维码和计划。现在就免费注册

行业
零售/电子商务

公司规模
2000 +员工

总部
古尔冈,哈里亚纳邦,印度

bob手机app官网产品/项目使用

79bob官方下载

Grafana洛基

普罗米修斯

Grafana云

200

Blinkit工程师使用Grafana Cloud


60结核病

在Grafana Loki每个月的日志数据