成功/ Houzz

Houzz如何使用Grafana Loki和Grafana Tempo提高可观察性、MTTR和MTTI

Houzz是夫妻团队Adi Tatarko和Alon Cohen创建的一个兼职项目,旨在为家庭装修和设计创造最佳体验。2009年,他们在改造自己的房子时产生了这个想法。他们感到沮丧的是,缺乏资源来帮助他们阐明自己的家庭愿景,并选择合适的专业人士使其成为现实。

在他们把自己的房子变成一个家之后,他们把Houzz变成了一个家居装修巨头。

十多年来,Houzz已经成为家庭装修和设计的领先平台,为人们提供从开始到结束改善他们的家所需要的一切。在Houzz上,人们可以找到设计灵感,研究和雇佣家庭专业人员,并购买产品来完成他们的项目。bob手机app官网对于家庭专业人士,Houzz Pro提供了一个一体化的软件解决方案,使行业专业人士脱颖而出,赢得客户,并有效和盈利地管理他们的项目。

今天,Houzz社区是由世界各地数百万的房主、家居设计爱好者和家居装修专业人士组成的。

用Grafana Loki和Grafana Tempo从巨石到微服务进行翻新

随着公司规模的扩大,他们也发现自己将技术堆栈从整体转变为微服务,这促使DevOps团队寻找合适的工具来提高日志的可见性和搜索能力。

但是他们的遗留的可观察性工具不能跟上大量的新数据,这使得DevOps和开发人员团队在需要日志时寻找日志成为一个恒定的问题。因此,当生产系统出现问题时,团队将花费越来越多的时间试图确定要查看的正确数据,而不是从一开始就解决根本问题。这阻碍了团队的生产力。

“作为一名DevOps工程师,我更喜欢CLI和终端屏幕。当我们转向微服务领域时,它不再是一个合适的解决方案,我研究的大多数日志记录解决方案都提供了太多的信息,所以很难找到我想要的确切日志,”Houzz的DevOps主管Yoram Kruvi说。bob彩票中奖计划

克鲁维说,他正在寻找一种“保持简单的方法”,并在Grafana洛基

在我们开始使用洛基之前,搜索日志是一个挑战。Grafana的一站式体验使我们能够通过应用程序工作负载和基础设施度量交叉引用数据,这节省了我们的时间,并使我们更容易搜索相关日志。

Yoram Kruvi, Houzz的DevOps主管


除了Grafana Loki正在解决的日志记录问题外,向微服务的转变也给Houzz带来了网络可观察性问题。作为回应,他们选择了Grafana Tempo作为追踪工具。

Houzz的DevOps工程师Roman Vogman表示:“当多个服务相互通信时,理解延迟增加的地方以及找到可以改进的地方变得更加困难,所以这就是Grafana Tempo的用处所在,并解决了这个问题。”“除此之外,拥有多个工具和UI以及在调试时从一个切换到另一个会让事情变得更复杂。而像Grafana Tempo这样的工具可以简化整个过程。”

Vogman很快指出,Grafana Loki和Grafana Tempo也是协同工作的。Vogman说:“将Grafana Loki中发现的日志直接连接到Grafana Tempo中的痕迹,所有这些都在同一个屏幕上,简化了调试过程。”

log-trace-relation

最近推出Grafana米密尔Vogman说,他渴望研究Grafana实验室的LGTM堆栈的另一个部分,希望为他们的公司带来更多的价值。bob电竞频道

Grafana Loki:非常适合Houzz日志管理

因为Prometheus的查询语言PromQL是LogQL (Grafana Loki的查询语言)的基础,所以为日志添加Loki是很自然的。

“我使用格拉芙娜和普罗米修斯已经很长时间了。当Loki发布时,它似乎非常适合我们的日志管理需求,”Kruvi说。

更好的是,实现Grafana Loki很容易。事实上,团队只花了5分钟就从一个Helm图表运行到一个Kubernetes集群。除了简单的开始,以下是为什么Houzz拥抱Grafana Loki的蓝图:

  • 一个快速发展的社区的一部分克鲁维说:“如果我有一个问题可以通过谷歌搜索得到答案,那就值得付出一切。”
  • 具有成本效益的克鲁维说:“Grafana Loki存储原木的方式比我们之前的解决方案经济得多。”bob彩票中奖计划
  • Kubernetes本地“拥有为云原生技术构建的东西对我们来说是一个巨大的胜利,”Kruvi说,并补充道,“这也有助于开始使用日志。”
  • 将度量和日志关联起来Kurvi补充道:“当我们有来自不同数据源的数据流时,Grafana能够将日志与来自同一页面的不同数据源的其他指标关联起来,并且能够访问这一块玻璃,这是游戏规则的改变者。”

Grafana Tempo: DIY演示

传统上,Houzz使用Zipkin服务器进行跟踪数据和分析。但是当Grafana Tempo发布时,DevOps团队决定基于Grafana Loki的性能来尝试新的开源解决方案。

他们没有失望。就像之前的Grafana Loki一样,进入Grafana Tempo是快速和容易的。团队进行了一次内部PoC,并立即看到了成功,但仍需要管理层的支持才能继续前进。因此,他们将目光转向在实际前端服务组件上进行Grafana Tempo的现场演示,并通过快速展示请求中浪费的时间,以及如何使用这些数据以比以前更快的速度缓解这些问题,让他们的管理层感到惊讶。

此外,如果出现任何问题,围绕Grafana Tempo不断发展和充满激情的开源社区被证明是无价的。沃格曼说:“我们决定在Grafana Tempo相对较新的时候尝试一下,所以针对我们遇到的不同问题没有太多的文档。”“当我们在设置或调整配置方面遇到困难时,我们经常向社区发表讲话,在几个小时内就能找到每个问题的答案。考虑到我们分布在世界各地的团队,这尤其令人印象深刻。”

DevOps团队列出了更多关于Grafana Tempo的设计细节:

  • 开源和易于使用Vogman指出:“一旦你有了一个架构,开始着手LGTM堆栈的下一部分是很自然的。”
  • 成本有效的因为它只需要对象存储来操作。
  • 与Grafana Loki深度融合“您可以很容易地从指标到日志到跟踪,然后再返回,”Vogman说。

但除了Grafana Tempo本身的力量之外,Houzz意识到它的价值还得益于Grafana Labs对“大帐篷”哲学的承诺。bob电竞频道Kruvi说道:“我们喜欢同时使用OpenTelemetry, Zipkin和Jaeger等多种资源,这为开发团队提供了选择最适合他们的内容的自由。

极端改造:可观察性版

有了Grafana Loki, Houzz团队现在可以在Grafana中可视化日志数据,并跟踪随时间变化的趋势。Grafana Loki通过一个按钮就可以运行最新的查询,过滤来自不同来源的日志,提供一个日志浏览器来根据日志标签进行搜索,并在时区之间轻松切换,考虑到他们作为全球领导者的地位,这对Houzz很重要。

对于Grafana Tempo,该工具很容易在整个企业中采用。这是因为它跟踪系统延迟,深入研究每个请求的细节,以及通过跨度可视化检测回归和改进点。

span-to-metric

开发人员还重视Grafana Tempo如何使用户能够在不同的数据源和不同的数据类型之间跳跃,以及如何作为一个容器应用程序可用,该应用程序可以运行在诸如Kubernetes这样的编排引擎上。

对于DevOps团队来说,因为Grafana,当我们掌握全局时,我们可以更快地做出反应,并且我们可以更好地支持更广泛的Houzz团队。我们不需要依赖多个系统。通过Grafana,所有的数据和指标都在相同的系统中以相同的视图呈现在我们眼前。

Yoram Kruvi, Houzz的DevOps主管

对Houzz来说,采用Grafana工具在多个层面上都非常有益。首先,Houzz在计算时间和存储上的花费减少了吗.此外,MTTR和MTTI也有所下降

Vogman说:“在Grafana的框架下管理所有的事情,花费在事件解决上的时间减少了,因为我们不需要在不同的系统之间跳转来寻找根本原因。”bob彩票中奖计划“我们还修复了许多地方,以防止真正的事故发生。”

“通过Prometheus、Tempo和Loki数据的相关性,我们能够找到系统中真正的问题,对它们进行端到端跟踪、修复,并立即看到恢复和改进,”Kruvi说。

也许在采用Loki和Tempo后,Houzz改进的最好迹象是其平台的正常运行时间和稳定性的增加,以及开发人员生产力的飞跃。随着开发人员在产品中检测问题的时间减少,这不仅提高了客户满意度,也提高了开发人员的满意度。Kruvi说道:“来自开发者的反馈是他们喜欢Grafana的简单性。“此外,弥补之前的盲点不仅增强了开发人员的自豪感,还为Houzz的用户提供了更好的平台用户体验。”

行业
软件与技术

公司规模
1700 +员工

总部
帕洛阿尔托,美国

bob手机app官网产品/项目使用

Grafana洛基

Grafana米密尔

Grafana节奏

Grafana云