O que você precisa saber sobre os lançamentos da AWS nesta semana — e como eles afetam sua operação no Brasil.
TL;DR: A semana trouxe o FinOps Agent (preview) para automatizar investigação de custos e anomalias, os modelos Gemma 4 no Bedrock com três variantes para diferentes cargas, e as instâncias M9g/M9gd com Graviton5, que entregam até 25% mais performance. Para empresas brasileiras, o destaque é a maturidade dos agentes de FinOps e a diversificação de modelos de IA, reduzindo dependência de um único provider.
Esta semana, Nova York está sediando o AWS Summit, reunindo builders, clientes e times da AWS para um dia inteiro de anúncios, demonstrações e sessões técnicas no Javits Center. Escrevi posts para alguns dos lançamentos do Summit, então estou animada para vê-los ao vivo esta semana. Só não estarei assistindo do Javits Center. Estarei em um festival de música de quatro dias, acompanhando os lançamentos pelo celular enquanto tento descobrir como montar uma barraca. Se você não pôde comparecer pessoalmente como eu, a livestream da keynote está disponível em 17 de junho, com Dr. Swami Sivasubramanian, VP de Agentic AI, e Chet Kapoor, VP de Security Services and Observability, cobrindo novas capacidades em ferramentas de desenvolvimento, infraestrutura de IA e segurança.

Aqui está o que aconteceu esta semana.
Como times de engenharia estão reinventando o desenvolvimento nativo de IA?
Headlines
How frontier teams are reinventing AI-native development — Swami publicou um post detalhado esta semana com dados de experimentos em centenas de equipes de engenharia da Amazon. As descobertas merecem leitura cuidadosa se você está pensando em como estruturar a adoção de IA no seu time.
Um time de seis engenheiros reconstruiu o motor de inferência do Amazon Bedrock em 76 dias — um projeto originalmente dimensionado para 30 desenvolvedores ao longo de 12 a 18 meses. O ganho mediano de produtividade em pilotos estruturados com times de Amazon Stores foi de 4,5x na velocidade de deployment normalizada, com alguns times ultrapassando 10x. O Perfect Order Experience passou de um ciclo de duas semanas para lançar em uma tarde. O WW Grocery reduziu a criação de documentos de design de cinco dias para algumas horas.
O post destila esses resultados em cinco práticas para se tornar um time de fronteira. Primeiro, invista em contexto do agente: construa steering files, padrões de código e repositórios estruturados antes de escrever código de produção. Segundo, espere uma desaceleração inicial enquanto os workflows são reestruturados e insista. Terceiro, mantenha um backlog constante de tarefas bem escopadas para que os agentes possam rodar em paralelo sem supervisão constante. Quarto, torne a intenção explícita por meio de especificações estruturadas antes da geração de código. Quinto, faça shift-left testing para que os agentes possam se autocorrigir antes que o código chegue ao pipeline.
O post encerra com uma nota de que a velocidade de commit é apenas parte do quadro, e que um follow-up cobrirá release management, operações, security operations e atualizações de EOL.
O que o AWS FinOps Agent (preview) muda na sua gestão de custos?
AWS FinOps Agent is now available in preview — O AWS FinOps Agent é um novo agente para profissionais de FinOps e times de engenharia que responde perguntas sobre custos, identifica oportunidades de otimização, investiga anomalias de custo e executa workflows recorrentes de FinOps em uma agenda definida. Você pode usá-lo para consultar seus custos AWS, gerar relatórios de custo para os times de finanças e engenharia, e obter recomendações de rightsizing, recursos ociosos e Savings Plans do AWS Cost Optimization Hub e AWS Compute Optimizer. O agente pode abrir tickets no Jira em seu nome com base nessas recomendações. Quando uma anomalia de custo é detectada, o FinOps Agent pode investigar automaticamente a causa raiz e postar descobertas em um canal do Slack.
Quais foram os principais lançamentos da semana passada?
Começo com um que escrevi esta semana, depois cubro os outros lançamentos que chamaram minha atenção:
-
Amazon EC2 M9g e M9gd instances are now generally available — Alimentadas por processadores AWS Graviton5 e construídas sobre o AWS Nitro System de sexta geração, as instâncias M9g entregam até 25% melhor performance computacional em comparação com as instâncias baseadas em Graviton4, com até 35% mais performance para aplicações web, até 35% para inferência de machine learning e até 30% para bancos de dados. O Graviton5 é o primeiro processador da frota AWS a suportar PCIe Gen6 e memória DDR5-8800, e inclui um cache L3 5x maior em comparação com a geração anterior. As instâncias M9g e M9gd oferecem até 15% mais largura de banda de rede e 20% mais largura de banda Amazon EBS em média entre os tamanhos em comparação com M8g. Este lançamento também introduz o Nitro Isolation Engine, um aprimoramento do Nitro System que usa verificação formal para fornecer isolamento matematicamente comprovado entre máquinas virtuais — estabelecendo o Nitro como o primeiro hypervisor cloud formalmente verificado. As instâncias M9gd adicionam até 11,4 TB de armazenamento local NVMe SSD com 30% mais IOPS em comparação com M8gd. Ambos os tipos de instância suportam Instance Bandwidth Configuration (IBC) para ajustar a alocação de largura de banda entre EBS e rede VPC em até 25%.
-
Anthropic Claude Fable 5 no Amazon Bedrock — O Claude Fable 5 foi lançado no Amazon Bedrock em 9 de junho, trazendo execução assíncrona de tarefas estendida, capacidades avançadas de visão em diagramas, gráficos e PDFs, e autoverificação proativa. O acesso requer aceitação do compartilhamento de dados via Data Retention API antes de invocar o modelo; a Anthropic exige retenção de 30 dias de inputs e outputs para modelos da classe Mythos. Nota importante sobre disponibilidade: Em 12 de junho, a Anthropic pediu à AWS que revogasse o acesso ao Claude Fable 5 e Claude Mythos 5 para todos os usuários para apoiar a conformidade com uma diretiva de controle de exportação do governo dos EUA. Todos os outros modelos, incluindo Opus 4.8, não são afetados. Leia o comunicado da Anthropic para mais detalhes. A AWS compartilhará novas atualizações assim que estiverem disponíveis.
-
Modelos Gemma 4 disponíveis no Amazon Bedrock — A família Gemma 4 do Google DeepMind já está disponível no Amazon Bedrock em três variantes: Gemma 4 31B (denso, janela de contexto de 256K tokens, adequado para cargas de raciocínio e codificação), Gemma 4 26B-A4B (arquitetura mixture-of-experts, voltada para cargas sensíveis a custo e latência) e Gemma 4 E2B (variante menor, projetada para casos de uso interativos de baixa latência). Todas as três suportam function calling nativo, saída estruturada, raciocínio, streaming de resposta, entrada multimodal em texto, imagem, vídeo e áudio, e mais de 35 idiomas.
-
Amazon OpenSearch Service lança MCP Apps para observabilidade agentic — O Amazon OpenSearch Service agora suporta MCP Apps, permitindo workflows de observabilidade dentro de IDEs agentic compatíveis, incluindo Claude Desktop e VS Code. Um agente de IA no seu ambiente local pode investigar incidentes usando logs, traces, métricas e alertas armazenados em domínios OpenSearch, coleções e Amazon Managed Service for Prometheus. Cada chamada de ferramenta MCP App retorna uma resposta dupla: um resumo em texto para o agente raciocinar e uma visualização interativa renderizada no mesmo thread da conversa. As ferramentas MCP App disponíveis cobrem investigação de logs, métricas e traces; performance de serviço; topologia; visualizações dinâmicas; saúde do agente; saúde do cluster; e pontuação de instrumentação.
Outras notícias AWS
Aqui estão alguns posts e atualizações adicionais que você pode achar úteis:
-
AWS CLI v1 entra em modo de manutenção — Quando o CLI v1 entra em modo de manutenção, as dependências botocore e s3transfer serão vendidas diretamente no código do CLI v1 em vez de instaladas como pacotes separados. Isso significa que atualizar o CLI v1 não atualizará mais os pacotes botocore ou s3transfer independentes, e instalar esses pacotes de forma independente não terá efeito nas versões usadas pelo CLI v1. Ambientes com CLI v1 e boto3 instalados conterão cópias separadas dessas bibliotecas. Novos lançamentos do CLI v1 serão limitados a correções críticas de bugs e problemas de segurança. O caminho recomendado é migrar para o AWS CLI v2.
-
AWS Workload Credentials Provider disponível — A AWS lançou um novo Workload Credentials Provider que permite que workloads obtenham credenciais AWS de curta duração sem exigir access keys de longo prazo. Isso suporta o gerenciamento de credenciais para aplicações executadas fora da AWS, dando aos times uma maneira de seguir padrões de least-privilege access para workloads em ambientes third-party ou on-premises.
-
Kiro Pro Max disponível — A Kiro introduziu um novo tier Pro Max, adicionando limites de uso mais altos, acesso aos modelos frontier mais recentes e capacidades agentic adicionais para times de desenvolvimento. O Kiro Pro Max é projetado para desenvolvedores profissionais que precisam de uso sustentado e de alto volume em codificação, geração de especificações e tarefas orientadas por agentes.
Próximos eventos AWS
Verifique sua agenda e inscreva-se nos próximos eventos AWS:
-
AWS Summits — AWS Summits são eventos gratuitos e presenciais cobrindo cloud e IA. Próximos: Nova York (17 de junho), Hong Kong (17 de junho), Xangai (23-24 de junho), Japão (25 de junho), Washington, D.C. (30 de junho – 1 de julho), Taipei (15 de julho) e Bogotá (30 de julho).
-
AWS Community Days — Conferências lideradas pela comunidade, planejadas e entregues por líderes comunitários. Próximos eventos incluem Montreal, Canadá (20 de junho), Indianápolis, EUA (24 de junho), Hangzhou, China (28 de junho), Bengaluru, Índia (11 de julho) e Yaoundé, Camarões (25 de julho).
Visite o AWS Builder Center para conhecer outros builders, contribuir com soluções e encontrar recursos que ajudam você a continuar construindo. Você também pode navegar pelos próximos eventos presenciais e virtuais liderados pela AWS, além de sessões focadas em desenvolvedores.
Perguntas Frequentes
-
O FinOps Agent já está disponível para uso em produção?
Não, o AWS FinOps Agent está em preview. Ele permite consultar custos, gerar relatórios, identificar oportunidades de rightsizing e recursos ociosos, e automatizar workflows como abertura de tickets no Jira e investigação de anomalias com postagem no Slack. -
Os modelos Gemma 4 no Bedrock substituem o Claude?
Não. Gemma 4 é uma alternativa open-weight do Google DeepMind com três variantes (31B denso, 26B MoE e E2B leve), cada uma com foco diferente (raciocínio, custo/performance, baixa latência). A escolha depende do workload: Claude segue disponível para casos que exigem maior capacidade de raciocínio e autoverificação. -
O que muda com as instâncias M9g/M9gd baseadas em Graviton5?
Elas oferecem até 25% mais performance computacional que as M8g, suporte a PCIe Gen6, DDR5-8800 e cache L3 5x maior. Além disso, o Nitro Isolation Engine é o primeiro hypervisor cloud formalmente verificado, garantindo isolamento matematicamente comprovado entre VMs. -
O AWS CLI v1 vai parar de funcionar?
O CLI v1 entrou em modo de manutenção: receberá apenas correções críticas de bugs e segurança. As dependências botocore e s3transfer serão vendidas diretamente no código, o que pode causar conflitos em ambientes com boto3. A recomendação é migrar para o AWS CLI v2. -
Como o Workload Credentials Provider ajuda empresas com workloads on-premises?
Ele permite que workloads fora da AWS obtenham credenciais temporárias sem usar access keys de longa duração, facilitando a adoção de least-privilege access em ambientes third-party ou on-premises. Isso reduz riscos de segurança em cenários híbridos.
Artigo originalmente publicado por Esra Kayabali em AWS News Blog.