Como a Imgix processa 8 bilhões de imagens diariamente com G4 VMs e NVIDIA Blackwell
Este artigo analisa a estratégia da Imgix ao migrar sua infraestrutura para G4 VMs no Google Cloud, utilizando GPUs NVIDIA Blackwell. Esta mudança permitiu o processamento de 8 bilhões de imagens diárias com uma redução de 50% na latência e um aumento de 6x no throughput. A conclusão é que, ao delegar o processamento intensivo a instâncias especializadas em hardware, empresas podem escalar operações complexas de IA e mídia sem necessidade de refatorar o core da aplicação.
No cenário web atual, a experiência do usuário depende diretamente da performance visual. Empresas que dependem de entrega de mídia em alta escala enfrentam o desafio constante de equilibrar qualidade, personalização e latência mínima. A Imgix, que processa mais de 8 bilhões de ativos diariamente, exemplifica essa necessidade ao evoluir sua infraestrutura de data centers privados para o Google Cloud AI Hypercomputer.
O desafio: Escala e performance em real-time
O principal gargalo para aplicações que realizam redimensionamento, conversão de formatos e aplicação de filtros em tempo real é a demanda computacional massiva. Tentar realizar isso sem a infraestrutura adequada resulta em latência acumulada e degradação da experiência do usuário. A filosofia da Imgix, que evita pré-renderização em massa, exige um ambiente "just-in-time" suportado por instâncias de altíssima performance.
A transição para a arquitetura de G4 VMs
Ao optar pelas novas G4 VMs, equipadas com oito GPUs NVIDIA RTX PRO 6000 Blackwell e processadores AMD Turin, a Imgix aproveitou o sistema de offload do Google Titanium. Esse recurso é fundamental: ao delegar as tarefas operacionais de segurança e tráfego de rede para o hardware Titanium, a empresa libera os ciclos das GPUs e CPUs para o processamento de carga pesada, gerando um ganho de throughput de até 168% devido à arquitetura P2P customizada.
Dentro da arquitetura da Imgix
O pipeline da Imgix ilustra como integrar bibliotecas de alto desempenho com hardware especializado:

- Ingestion: Os ativos são armazenados em um cache de 2.5 petabytes no Google Cloud Storage (GCS).
- Decoding: Utiliza nvJPEG e bibliotecas C para decodificar ativos em dados RGBA brutos, aproveitando o paralelismo das GPUs.
- Transformation: Um stack de Vulkan compute shaders trata as transformações como problemas matemáticos paralelos, otimizando o uso dos CUDA cores.
- Encoding and Delivery: Ferramentas aceleradas por hardware, como NVENC e NVDEC, garantem que a codificação e decodificação não bloqueiem as operações em curso.
A integração de bibliotecas como a NVIDIA DeepStream exemplifica o futuro da plataforma: análise de vídeo e tracking de objetos em tempo real utilizando a mesma infraestrutura de processamento de imagem.
Resultados e Eficiência Operacional
A migração para as G4 VMs não foi apenas uma troca de hardware; foi uma decisão estratégica de eficiência FinOps e de performance. Os resultados são claros: redução de 50% na latência (de 100ms para 50ms) e um aumento de 5x a 6x no throughput, tudo isso orquestrado via Terraform sem necessidade de refatoração do código da aplicação. A escalabilidade é garantida por um modelo híbrido que utiliza Cloud Run para gestão de sessões e instâncias gerenciadas em Compute Engine para o processamento de carga.
O futuro: IA Generativa em produção
O próximo passo na evolução da Imgix é integrar funcionalidades de GenAI — como remoção de objetos e upscaling avançado — diretamente no fluxo de trabalho. A escolha pelo Google AI Hypercomputer oferece o arcabouço tecnológico necessário para escalar essas cargas de trabalho com a confiabilidade que marcas globais exigem.
Perguntas Frequentes
-
A transição para G4 VMs exige a refatoração do código da aplicação?
Não necessariamente. No caso da Imgix, a atualização foi realizada via Terraform, permitindo a adoção das G4 VMs sem alterações no core da aplicação, focando na otimização da infraestrutura existente. -
Como o uso de G4 VMs melhora o throughput de processamento de imagens?
As G4 VMs utilizam instâncias equipadas com oito GPUs NVIDIA RTX PRO 6000 Blackwell e interconexão P2P customizada, permitindo que o processamento seja realizado em paralelo e com hardware offload, elevando significativamente a capacidade de carga por nó. -
Qual o papel do Google Titanium na arquitetura de G4 VMs?
O Titanium atua como um assistente administrativo para o servidor, descarregando tarefas de segurança e tráfego de dados para que os processadores principais foquem exclusivamente nas tarefas críticas de computação da aplicação.
Artigo originalmente publicado por Abhijeet RajwadeOutbound Product Manager, GPUs em Cloud Blog.