Escalando inferência de LLM multi-node com NVIDIA Dynamo-Grove no AKS (Parte 4)
Entenda como o NVIDIA Grove oferece uma API nativa do Kubernetes para descrever e operar serviços de inferência distribuída com agendamento em grupo, escalabilidade hierárquica e dependências de inicialização. Saiba como aplicar isso no AKS.
02/06/2026Ler mais