博客/工程

Grafana Tempo 1.1发布:新的对冲请求降低了45%的延迟

2021年8月27日 3分钟

Grafana Tempo 1.1已经发布了,就像我们的主要版本所显示的那样,没有突破性的变化。如果您愿意,请查看发布说明.但如果你发现发行说明有时很难解码,不要担心!以下是所有的亮点。

特性

文档中有很多详细的特性和增强,但是如果你运行的是一个大容量的Tempo集群,这里有一些你应该注意的。

对冲的请求

首先,对冲的请求当请求超过可配置的阈值时,允许您第二次将请求重试到后端。如果这个阈值设置为后端p99,那么Tempo将重试所有后端请求中最慢的1%。这将对《Tempo》的整体长尾产生惊人的影响:

如图所示,p99从~4.5s提高到2.5s,性能提高了45%。

租户指数

接下来,租户指数既能提高性能,又能降低Tempo TCO。以前,所有的查询器和压缩器都会定期轮询后端,以维护一个最新的后端块列表。现在只有一小部分的压缩器负责这一点,而其余的组件只是拉预构建的索引。

GCS每秒获得

后端查询减少了约60%,节省了大量成本。

缓存参数

最后,缓存参数已经添加,让您可以更好地控制块的哪些元素-以及哪些块-缓存。以前所有的bloom过滤器都是缓存的,对于较大的安装来说,这可能需要大量的缓存空间。我们打算在这里添加更多的功能,以帮助运营商更仔细地控制他们所需的缓存空间量。

错误修复

你可能会惊讶地发现Tempo确实存在bug,而在1.1版本中,我们很高兴能减少至少两个bug !

首先,查询器回到404年代启动后立即启动。这是因为查询器在完成一个完整的轮询周期之前就会连接到查询前端。这个问题已经通过要求在完成启动之前完成轮询周期来解决。

还有不健康的成员有时会陷入困境如果你使用memberlist。这个问题已经困扰我们一段时间了,终于解决了它真是太好了。此外,成员列表得到了改进,并添加了新的默认值,以提高环的可靠性并降低CPU和内存需求。多亏了彼得Štibrany在皮质中修复这些问题!

不支持!

是时候向一些旧的块格式说再见了。在1.1中,我们将弃用v0和v1块,在1.2中将完全移除对它们的支持。如果你使用的是Tempo 0.7.0或更高版本,那么你已经在使用v2块了,你没有什么可担心的。

但是,如果您使用的是0.6.0或更高版本,请参阅发布说明关于如何前进。提示:如果您现在升级到1.1,那么在1.2发布时就可以了。

接下来是什么?

Tempo的发布周期大约是每两个月一次。到目前为止,这很适合这个项目,我认为这是一个很好的节奏。我不能说我知道Tempo 1.2的所有内容,但是原生搜索的第一阶段(最近的跟踪)将被合并,所以请为之兴奋!

如果您对更多Tempo新闻或搜索进度感兴趣,请在Grafana Slack公共频道# Tempo加入我们,在论坛上提出一个问题在推特上联系,或加入我们的每月社区电话.在那儿见!

这是最简单的方法节奏与Grafana Cloud合作,以及我们的免费层现在包括50GB的痕迹以及50GB的日志和10K系列指标。你可以在这里免费注册