11 de junho de 202611 min de leitura

Amazon EC2 M9g e M9gd com Graviton5: O que muda para sua infraestrutura de IA e workloads CPU-intensivos?

Esra Kayabali

AWS Blog

Banner - Amazon EC2 M9g e M9gd com Graviton5: O que muda para sua infraestrutura de IA e workloads CPU-intensivos?

TL;DR: As novas instâncias Amazon EC2 M9g e M9gd, baseadas no processador Graviton5, oferecem ganhos expressivos de performance (até 35% em web e ML inference) sem alteração de código, além de introduzirem o Nitro Isolation Engine, primeiro hypervisor formalmente verificado. Para empresas brasileiras que buscam escalabilidade, redução de custos com Arm e suporte a agentic AI, essa é a opção mais madura do ecossistema AWS.

Os processadores AWS Graviton evoluíram consistentemente ao longo das gerações, entregando melhorias contínuas em performance computacional, price-performance e eficiência energética. No re:Invent 2025, a AWS anunciou em preview as instâncias Amazon EC2 M9g, as primeiras baseadas em Graviton5. Desde então, clientes testaram M9g em uma ampla gama de workloads e compartilharam resultados. A ClickHouse observou um ganho de 36% em performance comparado com M8g, sem nenhuma alteração de código. A Honeycomb alcançou 36% mais throughput por core em relação ao Graviton4, durante um teste A/B de 6 meses em workloads de observabilidade em produção. A HubSpot implantou M9g para bancos de dados MySQL e viu a duração das queries cair em até 60%. Hoje, as instâncias M9g estão geralmente disponíveis, junto com as novas M9gd para clientes que necessitam de armazenamento local NVMe SSD de alta velocidade e baixa latência. Ambas são alimentadas pelo Graviton5, o processador mais poderoso e energeticamente eficiente já construído pela AWS.

Imagem do processador Graviton5

Embora diversas instâncias Arm tenham sido introduzidas na indústria, nenhuma se aproxima da amplitude e profundidade do footprint do AWS Graviton. Após cinco gerações de silício customizado e oito anos de investimento contínuo, o Graviton alimenta mais de 350 tipos de instância atendendo mais de 120 mil clientes, desde startups a grandes empresas, um ecossistema robusto de parceiros ISV e um amplo conjunto de serviços gerenciados. Você pode usar Graviton para uma grande variedade de workloads, incluindo aplicações web, microserviços, analytics, bancos de dados, inferência de machine learning (ML), automação de design eletrônico (EDA), jogos e codificação de vídeo. À medida que as workloads se tornam mais intensivas em computação e orientadas a dados, muitos pediram mais poder de processamento, junto com maior largura de banda de rede e armazenamento para mover mais dados e concluir workloads mais rapidamente. Também projetamos essas instâncias para empacotar eficientemente computação, memória e I/O, maximizando a utilização de energia.

À medida que a IA passa de responder perguntas para executar ações, rodar código, usar ferramentas, avaliar resultados e orquestrar tarefas de múltiplas etapas, a demanda por computação CPU está crescendo rapidamente. O Graviton5 foi construído para essa mudança. Com 192 cores, um cache L3 5x maior, até 33% menor latência entre cores e memória DDR5 de alta largura de banda, o Graviton5 ajuda agentes a gastar menos tempo esperando em etapas CPU-bound, processando mais instruções, lidando com um grande número de ambientes concorrentes e mantendo aceleradores em movimento.

Parceria Meta e AWS Graviton (imagem referenciada no original)

A Meta está implantando Graviton em escala, começando com dezenas de milhões de cores para suportar seus esforços de agentic AI, tornando-se um dos maiores clientes Graviton do mundo. Workloads de agentic AI, incluindo raciocínio em tempo real, geração de código e orquestração de tarefas multi-etapa, são intensivas em CPU e se beneficiam da maior performance computacional, caches maiores, maior largura de banda de memória e densidade de cores do Graviton5.

O que há de novo nas M9g e M9gd

Construídas no sexto AWS Nitro System, as instâncias M9g são alimentadas por processadores AWS Graviton5 que oferecem maior performance computacional, caches maiores e escalabilidade de memória e I/O aprimorada em comparação com processadores Graviton4. O Graviton5 oferece até 25% melhor performance computacional em relação às instâncias baseadas em Graviton4, com até 35% mais velocidade para aplicações web, até 35% para inferência de machine learning e até 30% para bancos de dados. Como a primeira CPU da frota AWS a suportar a mais recente geração de PCIe Gen6 e DDR5-8800, as instâncias AWS Graviton5 entregam a memória mais rápida de qualquer instância de processador na nuvem e 5 vezes mais cache L3 em comparação com a geração anterior. Essas melhorias vêm também com melhor eficiência energética, ajudando a atingir metas de sustentabilidade sem comprometer a capacidade.

A largura de banda de rede e armazenamento foi expandida para acompanhar o crescimento computacional. As instâncias M9g e M9gd oferecem até 15% mais largura de banda de rede e 20% mais largura de banda média do Amazon Elastic Block Store (Amazon EBS) entre os tamanhos, com até o dobro da largura de banda de rede para o maior tamanho de instância. As instâncias M9g e M9gd também suportam Instance Bandwidth Configuration (IBC), um recurso que ajuda a ajustar a alocação de largura de banda entre Amazon EBS e Amazon Virtual Private Cloud (Amazon VPC) para uma instância Amazon EC2 em até 25%. O IBC pode ajudar a otimizar a performance para workloads com requisitos específicos de largura de banda, como desempenho de leitura e gravação de banco de dados, processamento de consultas e logging. Essas melhorias suportam movimentação de dados mais rápida e maior throughput para workloads que dependem de alto desempenho de I/O.

Segurança e isolamento são requisitos fundamentais para executar workloads na nuvem. Dentro do Nitro System, o AWS Nitro Hypervisor é projetado para isolar instâncias umas das outras, bem como dos operadores da AWS. Com as instâncias M9g e M9gd, estamos elevando ainda mais o padrão de segurança com a introdução do Nitro Isolation Engine. O Nitro Isolation Engine é uma melhoria no Nitro System que reforça o isolamento das instâncias e utiliza verificação formal para fornecer garantias de isolamento com precisão matemática. O Nitro Isolation Engine é um componente construído especificamente para garantir o isolamento entre máquinas virtuais, incluindo a mediação de todo o acesso à memória da VM, estado dos registradores da CPU e dispositivos de I/O por meio de um conjunto mínimo de APIs. O Nitro Isolation Engine utiliza verificação formal, uma técnica para demonstrar matematicamente que o hardware ou software se comporta conforme o esperado, e não apenas em casos de teste específicos. Essa técnica intensiva de verificação estabelece o Nitro como o primeiro hypervisor de nuvem formalmente verificado, inaugurando um novo padrão para segurança de nuvem comprovada matematicamente.

As instâncias M9g fornecem uma vCPU para cada 4 GiB de memória e são adequadas para uma ampla gama de workloads de propósito geral, incluindo servidores de aplicação, microserviços, armazenamentos de dados de médio porte, servidores de jogos, clusters de cache, aplicações conteinerizadas, aplicações Java de grande escala, repositórios de código, aplicações web e agentic AI.

Para workloads que precisam de armazenamento local de alta velocidade e baixa latência, as instâncias M9gd fornecem até 11,4 TB de armazenamento NVMe SSD e 30% mais IOPS e desempenho de armazenamento em comparação com as instâncias M8gd baseadas em Graviton4. As instâncias M9gd são adequadas para workloads de propósito geral que exigem um equilíbrio entre computação e memória com armazenamento local de alta velocidade e baixa latência, incluindo servidores de aplicação, microserviços, servidores de jogos, armazenamentos de chave-valor de médio porte, clusters de cache, logging de dados, processamento de mídia, processamento em lote e de logs, e aplicações que precisam de armazenamento temporário, como caches e arquivos temporários.

Aqui estão as principais especificações da família:

M9g vCPUs Memory (GiB) Network bandwidth (Gbps) EBS bandwidth (Gbps)
medium 1 4 Up to 15 Up to 12
large 2 8 Up to 15 Up to 12
xlarge 4 16 Up to 15 Up to 12
2xlarge 8 32 Up to 17 Up to 12
4xlarge 16 64 Up to 17 Up to 12
8xlarge 32 128 17 12
12xlarge 48 192 25 18
16xlarge 64 256 34 24
24xlarge 96 384 50 36
48xlarge 192 768 100 72
metal-48xl 192 768 100 72

As instâncias M9gd incluem armazenamento local NVMe SSD. A tabela abaixo mostra o armazenamento de instância para cada tamanho. As especificações de computação, memória, rede e largura de banda EBS são as mesmas do M9g.

M9gd vCPUs Memory (GiB) Instance storage (GB) Network bandwidth (Gbps) EBS bandwidth (Gbps)
medium 1 4 1 x 59 NVMe SSD Up to 15 Up to 12
large 2 8 1 x 118 NVMe SSD Up to 15 Up to 12
xlarge 4 16 1 x 237 NVMe SSD Up to 15 Up to 12
2xlarge 8 32 1 x 475 NVMe SSD Up to 17 Up to 12
4xlarge 16 64 1 x 950 NVMe SSD Up to 17 Up to 12
8xlarge 32 128 1 x 1900 NVMe SSD 17 12
12xlarge 48 192 3 x 950 NVMe SSD 25 18
16xlarge 64 256 1 x 3800 NVMe SSD 34 24
24xlarge 96 384 3 x 1900 NVMe SSD 50 36
48xlarge 192 768 3 x 3800 NVMe SSD 100 72
metal-48xl 192 768 3 x 3800 NVMe SSD 100 72

Disponibilidade

As instâncias M9g e M9gd estão disponíveis nas regiões US East (N. Virginia), US East (Ohio), US West (Oregon) e Europe (Frankfurt). As instâncias M9g e M9gd podem ser adquiridas via Savings Plans, On-Demand, Spot Instances, Dedicated Instances ou Dedicated Hosts. Para mais informações, visite a página de preços do Amazon EC2.

Para começar com as instâncias M9g e M9gd, diversos recursos estão disponíveis. O AWS Graviton Getting Started Guide é um guia técnico que cobre como construir, executar e otimizar workloads em instâncias baseadas em Graviton. O Graviton Savings Dashboard ajuda a rastrear e medir a economia de custos ao executar workloads em instâncias baseadas em Graviton. O AWS Transform é um serviço alimentado por IA que automatiza transformações de código para migrar aplicações Java de x86 para instâncias Amazon EC2 baseadas em Graviton, lidando com análise de compatibilidade, recompilação automatizada, atualizações de dependências e validação.

Para saber mais sobre instâncias baseadas em Graviton, visite AWS Graviton Processors ou Level up your compute with AWS Graviton.

Perguntas Frequentes

  • Quais workloads brasileiros se beneficiam mais com o Graviton5?
    Workloads CPU-intensivos como servidores web, microserviços, bancos de dados (MySQL, PostgreSQL), inferência de ML e aplicações Java se destacam. A Honeycomb, por exemplo, obteve 36% mais throughput por core em workloads de observabilidade. Para empresas brasileiras com aplicações de alto throughput, a migração pode reduzir custos operacionais sem comprometer desempenho.

  • Vale a pena migrar de M8g (Graviton4) para M9g?
    Sim, especialmente se sua aplicação é sensível a cache e latência entre cores. O Graviton5 oferece 5x mais L3 cache, 33% menor latência inter-core e DDR5-8800. A ClickHouse reportou 36% de performance boost sem code changes. A migração pode ser feita via AWS Transform para Java, mas é recomendado testar workloads específicos primeiro.

  • Como o Nitro Isolation Engine impacta a segurança de ambientes multi-tenant?
    O Nitro Isolation Engine é um componente dedicado que formalmente verifica o isolamento entre VMs, garantindo matematicamente que nenhum acesso indevido à memória, registradores ou I/O ocorra. Para empresas brasileiras que operam sob LGPD ou em setores regulados, essa verificação formal eleva o padrão de segurança e pode simplificar compliance.

  • O Graviton5 é recomendado para agentic AI em produção?
    Sim. A Meta já está implantando dezenas de milhões de cores Graviton para suportar agentic AI. O processador com 192 cores, cache ampliado e alta largura de banda de memória é ideal para tarefas de raciocínio em tempo real, execução de código e orquestração multi-etapa. Para empresas brasileiras que estão começando com agentic AI, é uma alternativa mais econômica que GPUs para cargas CPU-bound.

  • Como funciona o Instance Bandwidth Configuration (IBC) nas M9g?
    O IBC permite ajustar dinamicamente a alocação de banda entre EBS e VPC em até 25% para cada instância. Isso é útil para workloads com requisitos de I/O específicos, como bancos de dados que precisam de mais throughput de leitura/escrita. Para ambientes brasileiros com picos sazonais, o IBC pode otimizar custos sem precisar redimensionar a instância.


Artigo originalmente publicado por Esra Kayabali em AWS News Blog.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset