20 de maio de 20264 min de leitura

GKE Agent Sandbox e Agent Substrate: o novo patamar da infraestrutura para AI Agents

Tim Hockin

Google Cloud

Banner - GKE Agent Sandbox e Agent Substrate: o novo patamar da infraestrutura para AI Agents

GKE Agent Sandbox e Agent Substrate: o novo patamar da infraestrutura para AI Agents

A IA evoluiu para agentes autônomos que exigem execução rápida e isolada. O GKE Agent Sandbox, agora em GA, resolve o desafio da latência e custo ao introduzir snapshots e warm pools. Paralelamente, o projeto open-source Agent Substrate propõe uma camada de abstração para gerenciar milhões de agentes, contornando limitações do Kubernetes tradicional. A conclusão é que a infraestrutura precisa ser repensada para cargas de trabalho de alta densidade, alta intermitência e execução em sub-segundos.

Em pouco tempo, a IA migrou de simples interfaces de chat para agentes autônomos robustos, capazes de realizar function calling, execução de código e interações persistentes via terminal. Para times de engenharia no Brasil, o desafio mudou: não é apenas sobre treinar modelos, mas criar ambientes de computação que protejam a infraestrutura enquanto escalam a execução desse código inseguro (ou de terceiros).

Desde o anúncio inicial do GKE Agent Sandbox no KubeCon NA, observamos uma rápida adoção, com um crescimento de 16x no uso de sandboxes em GKE em apenas cinco meses. Este amadurecimento reflete uma mudança na forma como tratamos workloads de IA. Hoje, o projeto atinge o status de General Availability (GA), acompanhado pela introdução do Agent Substrate, um projeto open-source focado em densidade máxima de agentes.

Execução segura e de baixa latência em escala

O Agent Sandbox oferece uma base cloud-native no Kubernetes desenhada para o comportamento peculiar de agentes: ciclos de processamento curtos e intensos, seguidos por longos períodos de inatividade. Para nós, que focamos em eficiência operacional, os destaques técnicos são claros:

  • Pod Snapshots: Em vez de manter instâncias rodando desnecessariamente, o GKE Agent Sandbox suspende workloads ociosas, permitindo um resume em segundos. É o fim da computação desperdiçada.
  • Warm Pools & Latência: Manter warm pools integradas permite alocar 300 sandboxes por segundo, com 90% das alocações ocorrendo em até 200 milissegundos. Isso elimina o gargalo de cold start em aplicações de tempo real.
  • Eficiência de custos: A integração com buffers de capacidade em standby garante que o replenishment do warm pool seja feito a um custo reduzido.
  • Segurança (gVisor): O suporte nativo ao gVisor fornece a camada extra de isolamento necessária, mitigando riscos em cenários multitenant onde o código do agente não é confiável.

Além disso, o uso de processadores Axion demonstra um ganho de 30% em price-performance comparado a outras instâncias de mercado, um fator decisivo para o TCO em ambientes FinOps no Brasil.

O próximo passo: Agent Substrate

À medida que escalamos para milhões de instâncias de agentes, o control plane do Kubernetes enfrenta desafios de saturação. O Agent Substrate surge como um novo patamar de abstração. Ele mantém a base segura do Agent Sandbox, mas introduz um control plane minimalista desenhado para contornar limitações do Kubernetes tradicional em cenários de alta frequência.

Agent Substrate - Diagrama 1

Enquanto o Kubernetes é otimizado para serviços de longa duração, o Agent Substrate foca na "conversa" frequente de milhões de tool calls de curtíssima duração. A ideia aqui é otimizar o scheduling com suporte a data locality, garantindo que o estado e a computação estejam alinhados para reduzir cada milissegundo de overhead.

Construindo o futuro em comunidade

Assim como o início do Kubernetes foi marcado pela colaboração aberta para resolver problemas arquiteturais comuns, o Agent Substrate abre espaço para que a comunidade defina o padrão de infraestrutura agent-native. Convidamos os engenheiros brasileiros a explorarem essas ferramentas e colaborarem com o projeto no GitHub.

Para começar:


Artigo originalmente publicado por Tim Hockin, Software Engineer, GKE em Cloud Blog.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset