No cenário tecnológico atual, os maiores desafios muitas vezes não residem no código em si, mas na busca por consenso. Como padronizar a forma como sistemas se comunicam? Como evoluir um ecossistema que sustenta milhares de operações críticas sem causar rupturas?
Neste episódio do podcast “Grafana’s Big Tent”, Mat Ryer e Matt Toback recebem Ted Young, cofundador do OpenTelemetry e Diretor de Programas para Desenvolvedores na Grafana Labs. Eles discutem a evolução dos padrões de observabilidade, a realidade da adoção de tracing e por que o OpenTelemetry pode parecer, ao mesmo tempo, deliberadamente lento e implacavelmente rápido.
Abaixo, interpretamos os principais pontos dessa conversa sob uma ótica estratégica para o mercado brasileiro de tecnologia.

(Nota: O conteúdo a seguir destaca os pontos centrais do episódio 6, temporada 3 do podcast, editado para clareza e focado em impactos operacionais.)
Padronização: Redefinindo a Stack de Observabilidade
Ted Young: O OpenTelemetry não é apenas mais uma ferramenta; é uma nova forma de dividir a stack de observabilidade. Tradicionalmente, o setor era fragmentado por sinais: um sistema para logs, outro para metrics, outro para tracing, cada um com sua API, seu banco de dados e sua interface própria. Isso gerava silos de dados e redundância de trabalho.
A proposta do OpenTelemetry é padronizar a telemetria na origem. Se aplicações e sistemas falarem a mesma linguagem para descrever o que fazem, a correlação de dados acontece de forma natural. Para gestores no Brasil, isso significa reduzir o vendor lock-in e ganhar flexibilidade para trocarbackends de análise sem precisar re-instrumentar toda a aplicação.
Tracing, Logs e o Mito dos "Três Pilares"
Ted: Existe um acidente histórico que nos faz tratar logging e distributed tracing como coisas separadas. Na verdade, tracing é apenas logging com o contexto que sempre desejamos — a capacidade de saber a qual transação aquele evento pertence.
Para times de engenharia, a barreira para o tracing sempre foi o custo computacional e o armazenamento. Historicamente, o tracing era altamente amostrado (sampled) porque tentávamos inseri-lo sobre sistemas de logs que já eram caros. No OpenTelemetry, ao unificar o contexto, o tracing deixa de ser apenas uma ferramenta de análise de latency para se tornar a base do root cause analysis.
High Latency, High Throughput: O Ritmo do Comitê
O OpenTelemetry é frequentemente criticado pela lentidão em algumas definições. Ted Young usa a metáfora do "caracol de corrida": o projeto tem alta latência de decisão, mas altíssimo throughput de impacto.
Isso ocorre porque o projeto não pode se dar ao luxo de quebrar a compatibilidade reversa. Se uma biblioteca depende da versão 1.0 e outra da 2.0 e elas não conversam, todo o propósito de um padrão global cai por terra. Para empresas brasileiras que operam sistemas críticos, essa rigidez é uma garantia de estabilidade a longo prazo, protegendo o investimento feito em instrumentação.
Por que o Tracing demorou a decolar?
O principal bloqueador nunca foi a teoria, mas a complexidade da instalação. Propagar o contexto através de diferentes thread-pools e linguagens de programação exige um mecanismo de context propagation robusto.
Antes do OpenTelemetry, implementar tracing exigia uma cultura de engenharia monumental, comum apenas em gigantes como Google ou Microsoft. Agora, o padrão democratiza essa capacidade, permitindo que empresas de qualquer porte no Brasil tenham visibilidade end-to-end de suas transações distribuídas.
O Futuro: Observabilidade Zero-Touch e IA
O objetivo final é que ninguém precise "instalar" observabilidade. A meta é que o software já nasça instrumentado nativamente. Ted Young prevê um mundo onde desenvolvedores entreguem não apenas código, mas um "playbook" de como monitorar esse código.
Quanto à IA, a visão é pragmática: há 90% de chance de que as ferramentas apenas se tornem mais complexas e 10% de chance de uma mudança radical. Para o tomador de decisão, o foco imediato deve permanecer na qualidade dos dados de telemetria; afinal, qualquer IA de observabilidade só será tão boa quanto a precisão dos dados que o OpenTelemetry fornece.
Artigo originalmente publicado por Grafana Labs Team em Grafana Labs blog on Grafana Labs.