11 de junho de 2026•11 min de leitura

Amazon EC2 M9g e M9gd com Graviton5: O que muda para sua infraestrutura de IA e workloads CPU-intensivos?

Esra Kayabali

AWS Blog

Banner - Amazon EC2 M9g e M9gd com Graviton5: O que muda para sua infraestrutura de IA e workloads CPU-intensivos?

TL;DR: As novas instâncias Amazon EC2 M9g e M9gd, baseadas no processador Graviton5, oferecem ganhos expressivos de performance (até 35% em web e ML inference) sem alteração de código, além de introduzirem o Nitro Isolation Engine, primeiro hypervisor formalmente verificado. Para empresas brasileiras que buscam escalabilidade, redução de custos com Arm e suporte a agentic AI, essa é a opção mais madura do ecossistema AWS.

Os processadores AWS Graviton evoluíram consistentemente ao longo das gerações, entregando melhorias contínuas em performance computacional, price-performance e eficiência energética. No re:Invent 2025, a AWS anunciou em preview as instâncias Amazon EC2 M9g, as primeiras baseadas em Graviton5. Desde então, clientes testaram M9g em uma ampla gama de workloads e compartilharam resultados. A ClickHouse observou um ganho de 36% em performance comparado com M8g, sem nenhuma alteração de código. A Honeycomb alcançou 36% mais throughput por core em relação ao Graviton4, durante um teste A/B de 6 meses em workloads de observabilidade em produção. A HubSpot implantou M9g para bancos de dados MySQL e viu a duração das queries cair em até 60%. Hoje, as instâncias M9g estão geralmente disponíveis, junto com as novas M9gd para clientes que necessitam de armazenamento local NVMe SSD de alta velocidade e baixa latência. Ambas são alimentadas pelo Graviton5, o processador mais poderoso e energeticamente eficiente já construído pela AWS.

Imagem do processador Graviton5

Embora diversas instâncias Arm tenham sido introduzidas na indústria, nenhuma se aproxima da amplitude e profundidade do footprint do AWS Graviton. Após cinco gerações de silício customizado e oito anos de investimento contínuo, o Graviton alimenta mais de 350 tipos de instância atendendo mais de 120 mil clientes, desde startups a grandes empresas, um ecossistema robusto de parceiros ISV e um amplo conjunto de serviços gerenciados. Você pode usar Graviton para uma grande variedade de workloads, incluindo aplicações web, microserviços, analytics, bancos de dados, inferência de machine learning (ML), automação de design eletrônico (EDA), jogos e codificação de vídeo. À medida que as workloads se tornam mais intensivas em computação e orientadas a dados, muitos pediram mais poder de processamento, junto com maior largura de banda de rede e armazenamento para mover mais dados e concluir workloads mais rapidamente. Também projetamos essas instâncias para empacotar eficientemente computação, memória e I/O, maximizando a utilização de energia.

À medida que a IA passa de responder perguntas para executar ações, rodar código, usar ferramentas, avaliar resultados e orquestrar tarefas de múltiplas etapas, a demanda por computação CPU está crescendo rapidamente. O Graviton5 foi construído para essa mudança. Com 192 cores, um cache L3 5x maior, até 33% menor latência entre cores e memória DDR5 de alta largura de banda, o Graviton5 ajuda agentes a gastar menos tempo esperando em etapas CPU-bound, processando mais instruções, lidando com um grande número de ambientes concorrentes e mantendo aceleradores em movimento.

Parceria Meta e AWS Graviton (imagem referenciada no original)

A Meta está implantando Graviton em escala, começando com dezenas de milhões de cores para suportar seus esforços de agentic AI, tornando-se um dos maiores clientes Graviton do mundo. Workloads de agentic AI, incluindo raciocínio em tempo real, geração de código e orquestração de tarefas multi-etapa, são intensivas em CPU e se beneficiam da maior performance computacional, caches maiores, maior largura de banda de memória e densidade de cores do Graviton5.

O que há de novo nas M9g e M9gd

Construídas no sexto AWS Nitro System, as instâncias M9g são alimentadas por processadores AWS Graviton5 que oferecem maior performance computacional, caches maiores e escalabilidade de memória e I/O aprimorada em comparação com processadores Graviton4. O Graviton5 oferece até 25% melhor performance computacional em relação às instâncias baseadas em Graviton4, com até 35% mais velocidade para aplicações web, até 35% para inferência de machine learning e até 30% para bancos de dados. Como a primeira CPU da frota AWS a suportar a mais recente geração de PCIe Gen6 e DDR5-8800, as instâncias AWS Graviton5 entregam a memória mais rápida de qualquer instância de processador na nuvem e 5 vezes mais cache L3 em comparação com a geração anterior. Essas melhorias vêm também com melhor eficiência energética, ajudando a atingir metas de sustentabilidade sem comprometer a capacidade.

A largura de banda de rede e armazenamento foi expandida para acompanhar o crescimento computacional. As instâncias M9g e M9gd oferecem até 15% mais largura de banda de rede e 20% mais largura de banda média do Amazon Elastic Block Store (Amazon EBS) entre os tamanhos, com até o dobro da largura de banda de rede para o maior tamanho de instância. As instâncias M9g e M9gd também suportam Instance Bandwidth Configuration (IBC), um recurso que ajuda a ajustar a alocação de largura de banda entre Amazon EBS e Amazon Virtual Private Cloud (Amazon VPC) para uma instância Amazon EC2 em até 25%. O IBC pode ajudar a otimizar a performance para workloads com requisitos específicos de largura de banda, como desempenho de leitura e gravação de banco de dados, processamento de consultas e logging. Essas melhorias suportam movimentação de dados mais rápida e maior throughput para workloads que dependem de alto desempenho de I/O.

Segurança e isolamento são requisitos fundamentais para executar workloads na nuvem. Dentro do Nitro System, o AWS Nitro Hypervisor é projetado para isolar instâncias umas das outras, bem como dos operadores da AWS. Com as instâncias M9g e M9gd, estamos elevando ainda mais o padrão de segurança com a introdução do Nitro Isolation Engine. O Nitro Isolation Engine é uma melhoria no Nitro System que reforça o isolamento das instâncias e utiliza verificação formal para fornecer garantias de isolamento com precisão matemática. O Nitro Isolation Engine é um componente construído especificamente para garantir o isolamento entre máquinas virtuais, incluindo a mediação de todo o acesso à memória da VM, estado dos registradores da CPU e dispositivos de I/O por meio de um conjunto mínimo de APIs. O Nitro Isolation Engine utiliza verificação formal, uma técnica para demonstrar matematicamente que o hardware ou software se comporta conforme o esperado, e não apenas em casos de teste específicos. Essa técnica intensiva de verificação estabelece o Nitro como o primeiro hypervisor de nuvem formalmente verificado, inaugurando um novo padrão para segurança de nuvem comprovada matematicamente.

Quer avaliar o impacto do Graviton5 na sua operação? Converse com nossos especialistas em cloud e FinOps.

As instâncias M9g fornecem uma vCPU para cada 4 GiB de memória e são adequadas para uma ampla gama de workloads de propósito geral, incluindo servidores de aplicação, microserviços, armazenamentos de dados de médio porte, servidores de jogos, clusters de cache, aplicações conteinerizadas, aplicações Java de grande escala, repositórios de código, aplicações web e agentic AI.

Para workloads que precisam de armazenamento local de alta velocidade e baixa latência, as instâncias M9gd fornecem até 11,4 TB de armazenamento NVMe SSD e 30% mais IOPS e desempenho de armazenamento em comparação com as instâncias M8gd baseadas em Graviton4. As instâncias M9gd são adequadas para workloads de propósito geral que exigem um equilíbrio entre computação e memória com armazenamento local de alta velocidade e baixa latência, incluindo servidores de aplicação, microserviços, servidores de jogos, armazenamentos de chave-valor de médio porte, clusters de cache, logging de dados, processamento de mídia, processamento em lote e de logs, e aplicações que precisam de armazenamento temporário, como caches e arquivos temporários.

Aqui estão as principais especificações da família:

M9g	vCPUs	Memory (GiB)	Network bandwidth (Gbps)	EBS bandwidth (Gbps)
medium	1	4	Up to 15	Up to 12
large	2	8	Up to 15	Up to 12
xlarge	4	16	Up to 15	Up to 12
2xlarge	8	32	Up to 17	Up to 12
4xlarge	16	64	Up to 17	Up to 12
8xlarge	32	128	17	12
12xlarge	48	192	25	18
16xlarge	64	256	34	24
24xlarge	96	384	50	36
48xlarge	192	768	100	72
metal-48xl	192	768	100	72

As instâncias M9gd incluem armazenamento local NVMe SSD. A tabela abaixo mostra o armazenamento de instância para cada tamanho. As especificações de computação, memória, rede e largura de banda EBS são as mesmas do M9g.

M9gd	vCPUs	Memory (GiB)	Instance storage (GB)	Network bandwidth (Gbps)	EBS bandwidth (Gbps)
medium	1	4	1 x 59 NVMe SSD	Up to 15	Up to 12
large	2	8	1 x 118 NVMe SSD	Up to 15	Up to 12
xlarge	4	16	1 x 237 NVMe SSD	Up to 15	Up to 12
2xlarge	8	32	1 x 475 NVMe SSD	Up to 17	Up to 12
4xlarge	16	64	1 x 950 NVMe SSD	Up to 17	Up to 12
8xlarge	32	128	1 x 1900 NVMe SSD	17	12
12xlarge	48	192	3 x 950 NVMe SSD	25	18
16xlarge	64	256	1 x 3800 NVMe SSD	34	24
24xlarge	96	384	3 x 1900 NVMe SSD	50	36
48xlarge	192	768	3 x 3800 NVMe SSD	100	72
metal-48xl	192	768	3 x 3800 NVMe SSD	100	72

Disponibilidade

As instâncias M9g e M9gd estão disponíveis nas regiões US East (N. Virginia), US East (Ohio), US West (Oregon) e Europe (Frankfurt). As instâncias M9g e M9gd podem ser adquiridas via Savings Plans, On-Demand, Spot Instances, Dedicated Instances ou Dedicated Hosts. Para mais informações, visite a página de preços do Amazon EC2.

Para começar com as instâncias M9g e M9gd, diversos recursos estão disponíveis. O AWS Graviton Getting Started Guide é um guia técnico que cobre como construir, executar e otimizar workloads em instâncias baseadas em Graviton. O Graviton Savings Dashboard ajuda a rastrear e medir a economia de custos ao executar workloads em instâncias baseadas em Graviton. O AWS Transform é um serviço alimentado por IA que automatiza transformações de código para migrar aplicações Java de x86 para instâncias Amazon EC2 baseadas em Graviton, lidando com análise de compatibilidade, recompilação automatizada, atualizações de dependências e validação.

Para saber mais sobre instâncias baseadas em Graviton, visite AWS Graviton Processors ou Level up your compute with AWS Graviton.

Perguntas Frequentes

Quais workloads brasileiros se beneficiam mais com o Graviton5?
Workloads CPU-intensivos como servidores web, microserviços, bancos de dados (MySQL, PostgreSQL), inferência de ML e aplicações Java se destacam. A Honeycomb, por exemplo, obteve 36% mais throughput por core em workloads de observabilidade. Para empresas brasileiras com aplicações de alto throughput, a migração pode reduzir custos operacionais sem comprometer desempenho.
Vale a pena migrar de M8g (Graviton4) para M9g?
Sim, especialmente se sua aplicação é sensível a cache e latência entre cores. O Graviton5 oferece 5x mais L3 cache, 33% menor latência inter-core e DDR5-8800. A ClickHouse reportou 36% de performance boost sem code changes. A migração pode ser feita via AWS Transform para Java, mas é recomendado testar workloads específicos primeiro.
Como o Nitro Isolation Engine impacta a segurança de ambientes multi-tenant?
O Nitro Isolation Engine é um componente dedicado que formalmente verifica o isolamento entre VMs, garantindo matematicamente que nenhum acesso indevido à memória, registradores ou I/O ocorra. Para empresas brasileiras que operam sob LGPD ou em setores regulados, essa verificação formal eleva o padrão de segurança e pode simplificar compliance.
O Graviton5 é recomendado para agentic AI em produção?
Sim. A Meta já está implantando dezenas de milhões de cores Graviton para suportar agentic AI. O processador com 192 cores, cache ampliado e alta largura de banda de memória é ideal para tarefas de raciocínio em tempo real, execução de código e orquestração multi-etapa. Para empresas brasileiras que estão começando com agentic AI, é uma alternativa mais econômica que GPUs para cargas CPU-bound.
Como funciona o Instance Bandwidth Configuration (IBC) nas M9g?
O IBC permite ajustar dinamicamente a alocação de banda entre EBS e VPC em até 25% para cada instância. Isso é útil para workloads com requisitos de I/O específicos, como bancos de dados que precisam de mais throughput de leitura/escrita. Para ambientes brasileiros com picos sazonais, o IBC pode otimizar custos sem precisar redimensionar a instância.

Artigo originalmente publicado por Esra Kayabali em AWS News Blog.

Tags:

#Graviton5 #AWS #EC2 #M9g #M9gd #CloudComputing #IA #Performance #Segurança

Gostou? Compartilhe:

Amazon EC2 M9g e M9gd com Graviton5: O que muda para sua infraestrutura de IA e workloads CPU-intensivos?

Esra Kayabali

Perguntas Frequentes

Você também pode gostar

Open Knowledge Format (OKF): um padrão aberto para o conhecimento que seus agentes de IA precisam

Como medir o impacto de tokens da invocação de ferramentas MCP no Microsoft Foundry