12 de maio de 20264 min de leitura

Como a Imgix processa 8 bilhões de imagens diariamente com G4 VMs e NVIDIA Blackwell

Abhijeet Rajwade

Google Cloud

Banner - Como a Imgix processa 8 bilhões de imagens diariamente com G4 VMs e NVIDIA Blackwell

Como a Imgix processa 8 bilhões de imagens diariamente com G4 VMs e NVIDIA Blackwell

Este artigo analisa a estratégia da Imgix ao migrar sua infraestrutura para G4 VMs no Google Cloud, utilizando GPUs NVIDIA Blackwell. Esta mudança permitiu o processamento de 8 bilhões de imagens diárias com uma redução de 50% na latência e um aumento de 6x no throughput. A conclusão é que, ao delegar o processamento intensivo a instâncias especializadas em hardware, empresas podem escalar operações complexas de IA e mídia sem necessidade de refatorar o core da aplicação.

No cenário web atual, a experiência do usuário depende diretamente da performance visual. Empresas que dependem de entrega de mídia em alta escala enfrentam o desafio constante de equilibrar qualidade, personalização e latência mínima. A Imgix, que processa mais de 8 bilhões de ativos diariamente, exemplifica essa necessidade ao evoluir sua infraestrutura de data centers privados para o Google Cloud AI Hypercomputer.

O desafio: Escala e performance em real-time

O principal gargalo para aplicações que realizam redimensionamento, conversão de formatos e aplicação de filtros em tempo real é a demanda computacional massiva. Tentar realizar isso sem a infraestrutura adequada resulta em latência acumulada e degradação da experiência do usuário. A filosofia da Imgix, que evita pré-renderização em massa, exige um ambiente "just-in-time" suportado por instâncias de altíssima performance.

A transição para a arquitetura de G4 VMs

Ao optar pelas novas G4 VMs, equipadas com oito GPUs NVIDIA RTX PRO 6000 Blackwell e processadores AMD Turin, a Imgix aproveitou o sistema de offload do Google Titanium. Esse recurso é fundamental: ao delegar as tarefas operacionais de segurança e tráfego de rede para o hardware Titanium, a empresa libera os ciclos das GPUs e CPUs para o processamento de carga pesada, gerando um ganho de throughput de até 168% devido à arquitetura P2P customizada.

Dentro da arquitetura da Imgix

O pipeline da Imgix ilustra como integrar bibliotecas de alto desempenho com hardware especializado:

1-Image-Processing-wf

  1. Ingestion: Os ativos são armazenados em um cache de 2.5 petabytes no Google Cloud Storage (GCS).
  2. Decoding: Utiliza nvJPEG e bibliotecas C para decodificar ativos em dados RGBA brutos, aproveitando o paralelismo das GPUs.
  3. Transformation: Um stack de Vulkan compute shaders trata as transformações como problemas matemáticos paralelos, otimizando o uso dos CUDA cores.
  4. Encoding and Delivery: Ferramentas aceleradas por hardware, como NVENC e NVDEC, garantem que a codificação e decodificação não bloqueiem as operações em curso.

A integração de bibliotecas como a NVIDIA DeepStream exemplifica o futuro da plataforma: análise de vídeo e tracking de objetos em tempo real utilizando a mesma infraestrutura de processamento de imagem.

Resultados e Eficiência Operacional

A migração para as G4 VMs não foi apenas uma troca de hardware; foi uma decisão estratégica de eficiência FinOps e de performance. Os resultados são claros: redução de 50% na latência (de 100ms para 50ms) e um aumento de 5x a 6x no throughput, tudo isso orquestrado via Terraform sem necessidade de refatoração do código da aplicação. A escalabilidade é garantida por um modelo híbrido que utiliza Cloud Run para gestão de sessões e instâncias gerenciadas em Compute Engine para o processamento de carga.

O futuro: IA Generativa em produção

O próximo passo na evolução da Imgix é integrar funcionalidades de GenAI — como remoção de objetos e upscaling avançado — diretamente no fluxo de trabalho. A escolha pelo Google AI Hypercomputer oferece o arcabouço tecnológico necessário para escalar essas cargas de trabalho com a confiabilidade que marcas globais exigem.

Perguntas Frequentes

  • A transição para G4 VMs exige a refatoração do código da aplicação?
    Não necessariamente. No caso da Imgix, a atualização foi realizada via Terraform, permitindo a adoção das G4 VMs sem alterações no core da aplicação, focando na otimização da infraestrutura existente.

  • Como o uso de G4 VMs melhora o throughput de processamento de imagens?
    As G4 VMs utilizam instâncias equipadas com oito GPUs NVIDIA RTX PRO 6000 Blackwell e interconexão P2P customizada, permitindo que o processamento seja realizado em paralelo e com hardware offload, elevando significativamente a capacidade de carga por nó.

  • Qual o papel do Google Titanium na arquitetura de G4 VMs?
    O Titanium atua como um assistente administrativo para o servidor, descarregando tarefas de segurança e tráfego de dados para que os processadores principais foquem exclusivamente nas tarefas críticas de computação da aplicação.


Artigo originalmente publicado por Abhijeet RajwadeOutbound Product Manager, GPUs em Cloud Blog.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset