8 de março de 202614 min de leitura

Esta semana em cloud (02–08/mar): o MWC ligou a rede à IA agêntica

Redação Nuvem Online

Nuvem Online

Banner - Esta semana em cloud (02–08/mar): o MWC ligou a rede à IA agêntica

TL;DR: Semana de Mobile World Congress, e o fio condutor foi a rede operando a si mesma: a Google Cloud levou agentes de IA ao core das telcos (VoLTE, Data Steward, Nokia Network-as-Code) e a Amazon pôs US$ 50 bi na OpenAI. No andar de baixo, o Nginx Ingress foi aposentado, plataformas de IA convergiram para o Kubernetes e o GTIG mostrou zero-days virando arma corporativa. IA agêntica deixou de ser modelo e virou operação.

Foi uma semana de Mobile World Congress, e em semana de MWC o eixo da conversa se desloca da cloud genérica para onde ela toca o mundo físico: a rede. O que costuma sair desses palcos é uma enxurrada de demos com nome bonito e pouca consequência operacional. Desta vez, porém, havia um tema único e nítido amarrando os anúncios mais sérios — a IA agêntica desceu da camada do modelo, onde virou commodity de conversa, para a camada de operação: a rede, a borda e o cluster passando a sentir, decidir e corrigir a si mesmos.

Três frentes se encaixam nesse mesmo tabuleiro. No telecom, a Google Cloud transformou seu framework de redes autônomas num enxame de agentes que gerenciam o voice core e o acesso de rádio — com a One NZ e a MasOrange já em campo. No mercado, a Amazon carimbou um cheque de US$ 50 bilhões na OpenAI e abriu o OpenClaw no Lightsail, sinalizando que agente autônomo virou produto de prateleira. E na infraestrutura que sustenta tudo isso, o Nginx Ingress foi formalmente aposentado enquanto a CNCF documentava a convergência de toda plataforma de IA para o Kubernetes.

A leitura para quem opera infra no Brasil é a de sempre, em escala nova: a IA agêntica não dispensou rede, governança e custo — ela cobrou que cada uma dessas camadas amadurecesse o suficiente para deixar um agente agir sozinho sem derrubar a produção. E, no pano de fundo, o GTIG lembrou que a borda da rede — justamente a que vira "autônoma" — é hoje o alvo predileto dos zero-days.

Por que o MWC 2026 foi sobre a rede operar a si mesma?

O recado central do MWC veio da Google Cloud, que parou de falar em "IA para extrair insights" e passou a falar em redes compostas por agentes que sentem, raciocinam e tomam decisões autônomas. A meta declarada é o Nível 4 a 5 de autonomia — uma rede que identifica, diagnostica e corrige os próprios problemas sem intervenção humana. Para sustentar isso, a plataforma evoluiu o Spanner Graph e o Vertex AI: o network digital twin deixou de ser mapa estático e virou grafo temporal dinâmico, capaz de mostrar como a rede estava cinco horas atrás para fazer root-cause analysis instantâneo, com Graph Neural Networks (GNNs) treinadas para prever como uma falha se propaga antes de impactar o assinante.

O gargalo que essa visão expôs não é de modelo, é de dados — e foi onde saíram os anúncios concretos. O Autonomous Data Steward, um agente baseado em Gemini, ataca a fragmentação de silos com arquitetura zero-copy sobre o Dataplex Universal Catalog: em vez de duplicar terabytes, guarda ponteiros de metadados e corta o custo de armazenamento em até 70%. Quando alguém pede "taxa de queda de célula" em linguagem natural, ele mapeia a intenção para contadores específicos de fornecedor e, se o dataset não existir, escreve e executa o ETL sozinho via Dataproc — reduzindo semanas de engenharia a minutos. Sobre essa fundação roda o Core Network VoLTE Agent, que correlaciona sinalização SIP/Diameter com performance de CSCF para diagnosticar e recomendar correção de qualidade de voz; a One NZ já o usa em produção. Em paralelo, a MasOrange apresentou uma PoC com a NetAI usando GraphML sobre a biblioteca aberta tf-GNN, e a Nokia firmou parceria para transformar sua plataforma Network as Code em agentes que entendem linguagem natural.

Para o mercado brasileiro, o ponto não é a sigla nova, é o padrão: a telco está aplicando à rede a mesma lógica que o Kubernetes já trouxe para o data center — closed-loop, self-healing, declaração de intenção em vez de comando manual. Quem opera infraestrutura crítica deveria ler esses anúncios menos como "novidade da operadora" e mais como o blueprint que vai descer para qualquer ambiente distribuído de baixa latência.

Amazon, OpenAI e OpenClaw: o agente autônomo virou produto de prateleira

Se no telecom o agente entrou na rede, no mercado ele entrou na vitrine. A Amazon anunciou um investimento de US$ 50 bilhões na OpenAI, numa parceria estratégica plurianual em que a AWS se torna o provedor exclusivo de nuvem de terceiros para a OpenAI Frontier — voltada a organizações que constroem e operam times de agentes de IA. O acordo expande um contrato existente para a casa dos US$ 100 bilhões ao longo de oito anos, com a OpenAI se comprometendo a consumir cerca de 2 gigawatts de capacidade dos chips Trainium (linhas Trainium3 e a próxima Trainium4). Juntos, AWS e OpenAI estão cocriando um Stateful Runtime Environment no Amazon Bedrock, que permite a agentes manter contexto e lembrar de trabalhos anteriores.

A democratização vem logo abaixo do cheque bilionário. A AWS levou o OpenClaw à disponibilidade geral no Amazon Lightsail: um agente de IA autônomo, privado e self-hosted que executa tarefas práticas — gerenciar e-mails, navegar na web, organizar arquivos — e se integra a WhatsApp, Discord ou Telegram, usando o Bedrock como provedor padrão de LLMs. O argumento é eliminar o atrito: antes era preciso configurar uma instância EC2 do zero; agora um blueprint pré-configurado sobe o ambiente em minutos. A nota de cautela, porém, é a parte que importa para quem opera: rodar agente autônomo amplia a superfície de ataque. A recomendação técnica é não expor o gateway à internet pública sem proteção, tratar o gateway token como secret crítica e rotacioná-lo — o agente conveniente é também um novo vetor.

A fatura da IA vence no Kubernetes: convergência, fim do Nginx e o custo da inferência

Por baixo dos agentes, alguém precisa sustentar a carga — e a semana deixou claro onde essa conta cai. Um artigo da CNCF documentou o que chamou de "a grande migração": no levantamento de janeiro de 2026, 82% dos usuários de containers já rodam Kubernetes em produção e 66% das organizações que hospedam IA generativa o usam para parte ou a totalidade da inferência. O Kubernetes deixou de ser plataforma de microservices stateless para virar a fundação única de processamento de dados, treinamento, serving e agentes — com DRA substituindo os Device Plugins na gestão de GPU, Kueue e Volcano resolvendo gang scheduling, e vLLM virando padrão de serving. A métrica de sucesso mudou junto: não é mais densidade de pods, é tokens-per-second-per-dollar.

Na borda do cluster, o sinal mais concreto foi a aposentadoria do Nginx Ingress. O anúncio formal saiu em 11 de novembro de 2025, e a recomendação é direta: migre para o Gateway API, GA desde 2023. O ingress-nginx entra em modo de manutenção — sem novas features, com correções de segurança por prazo definido. Um benchmark independente conduzido por Howard John, que analisamos em detalhe nesta semana, separou as alternativas viáveis: Istio passou em todos os testes sem ressalva, e o Agentgateway entregou propagação de rotas de 10–30ms com data plane usando 25–50x menos memória. O próprio Nginx, sob carga simultânea, travou por mais de cinco minutos e teve throughput até 20x pior por não reaproveitar conexões. Manter o ingress-nginx em projeto novo deixou de ser pragmatismo e virou dívida com prazo.

A terceira peça é a economia. A Microsoft, junto à Anyscale, lembrou que inferência de LLM é um problema de alocação de capital: ela opera num trilema entre accuracy, latency e custo — a Fronteira de Pareto —, onde melhorar uma dimensão piora as outras. O vilão silencioso é o KV cache, que cresce linearmente com contexto e concorrência, domina a VRAM e é a causa primária de OOM. Em clusters cobrados por uptime de nó, GPU ociosa é dinheiro queimado, e context length vira a alavanca de FinOps mais crítica. No mesmo eixo, o GKE passou a suportar custom metrics nativamente no HPA — escalando por KV cache usage ou profundidade de fila sem adaptadores nem o labirinto de IAM —, e as H4D VMs chegaram a GA com AMD EPYC de 5ª geração e Cloud RDMA, entregando até 5,8x de speed-up em HPC por valores na casa de 3 centavos de dólar por core-hora. Tudo aponta para a mesma direção: a inteligência é barata de demonstrar e cara de operar — e a conta vence na infraestrutura.

A borda virou alvo: zero-days corporativos, Coruna e hardening

Há uma ironia amarrando a semana: a mesma borda da rede que está virando "autônoma" é hoje o alvo predileto de quem ataca. O Google Threat Intelligence Group (GTIG) rastreou 90 zero-days explorados in-the-wild em 2025, e o dado estrutural não é o volume — é o alvo. 43 falhas (48%) atingiram tecnologias enterprise, recorde histórico, com 21 delas em dispositivos de borda como roteadores e firewalls. O motivo é cirúrgico: esses equipamentos raramente têm EDR, criando pontos cegos perfeitos para invisibilidade. Os Commercial Surveillance Vendors superaram pela primeira vez os grupos estatais tradicionais em zero-days atribuídos, e a exploração de software passou o phishing como vetor principal de acesso inicial nas investigações da Mandiant.

A face concreta dessa profissionalização foi o Coruna, um exploit kit para iOS com 23 exploits e cinco chains completas, cobrindo do iOS 13 ao 17.2.1. O GTIG o viu primeiro nas mãos de um fornecedor de vigilância comercial, depois em ataques de watering hole contra usuários ucranianos (grupo UNC6353) e, por fim, em campanhas de larga escala de um ator financeiro chinês (UNC6691). O detalhe que importa para o Brasil: o payload final, o PLASMAGRID, não fazia espionagem clássica — caçava frases-semente BIP39 e exfiltrava carteiras como MetaMask e Trust Wallet. Capacidade de Estado-nação reaproveitada para roubo financeiro, com o celular como elo fraco no acesso à cloud corporativa.

A resposta que a Mandiant prescreve é arquitetural, não reativa. Contra ataques destrutivos e wipers, a recomendação é montar um Out-of-Band Incident Command desvinculado do Identity Plane principal (se o Entra ID ou o Okta cair, você ainda precisa coordenar a recuperação), validar a restauração end-to-end de backups imutáveis e isolados, aplicar egress deny-by-default em servidores críticos para sufocar beacons de C2, e enclausurar o acesso a hypervisors — porque um atacante no vSphere copia o .ntds.dit direto do storage, ignorando o SO convidado. Some a isso MFA forte (FIDO2/WebAuthn) no lugar de SMS, e um SBOM atualizado para localizar bibliotecas vulneráveis no minuto seguinte ao próximo Log4j.

O que levar desta semana

O MWC 2026 não inaugurou um paradigma — ele mostrou a IA agêntica descendo da camada de modelo para a camada de operação, e cobrando maturidade de cada andar abaixo. Telecom: a Google Cloud levou agentes ao core da rede (VoLTE, Data Steward, Nokia), e o padrão closed-loop self-healing que valida na One NZ é o mesmo que vai descer para qualquer ambiente distribuído. Mercado: os US$ 50 bi da Amazon na OpenAI e o OpenClaw no Lightsail confirmam que agente virou produto — mas cada agente exposto é nova superfície de ataque. Infraestrutura: plataformas de IA convergiram de vez para o Kubernetes, o Nginx Ingress foi aposentado em favor do Gateway API, e a inferência se revelou um problema de FinOps antes de ser de modelo. Segurança: o GTIG provou que a borda autônoma é o alvo, e a defesa é hardening arquitetural, não assinatura. Quem operar essas quatro frentes com disciplina vai colher a autonomia sem pagar a estabilidade. Quem só consumir o keynote vai descobrir, no primeiro incidente ou na primeira fatura, que rede autônoma é, antes de tudo, infraestrutura bem operada.

Perguntas Frequentes

O Nginx Ingress foi mesmo descontinuado? Preciso migrar agora?
Sim. Em 11 de novembro de 2025 o projeto Kubernetes anunciou a aposentadoria do ingress-nginx e recomendou a migração para o Gateway API. Não é abandono imediato — há período de transição —, mas o ingress-nginx entrou em modo de manutenção: sem novas funcionalidades e com correções de segurança por prazo definido. O Gateway API já está GA desde 2023, suporta multi-tenancy nativo e múltiplos protocolos. Comece pelo inventário de annotations nginx.ingress.kubernetes.io/* antes de escolher a implementação.

Quais implementações do Gateway API substituem bem o Nginx?
Segundo o benchmark independente de Howard John, Istio e Agentgateway foram as duas mais sólidas. O Istio passou em todos os testes sem ressalva, com ecossistema maduro (mTLS, telemetria) e maturidade CNCF Graduated. O Agentgateway entregou propagação de rotas de 10–30ms e data plane com uso de memória 25–50x menor. O Nginx, sob carga, travou por mais de 5 minutos e teve throughput até 20x pior por falta de connection pooling. Para coexistência, o Ingress e o Gateway API rodam em paralelo, permitindo migração gradual.

O que a Google Cloud anunciou em redes autônomas no MWC 2026?
A Google Cloud apresentou a evolução de seu Autonomous Network Operations framework, saindo de IA para insights rumo a agentes que sentem, raciocinam e agem. Os destaques: o Autonomous Data Steward, um agente Gemini com arquitetura zero-copy via Dataplex que reduz custo de armazenamento em até 70%; o Core Network VoLTE Agent, já em uso na One NZ para autocorrigir qualidade de voz; a PoC da MasOrange com a NetAI usando GraphML/GNNs sobre Spanner Graph; e a parceria com a Nokia para transformar a plataforma Network as Code em agentes que entendem linguagem natural.

Por que a inferência de LLM é descrita como problema de alocação de capital?
Porque em produção a inferência, não o treinamento, é o maior motor de consumo de cloud, e ela opera num trilema entre accuracy, latency e custo — a Fronteira de Pareto dos LLMs: você escolhe dois e contorna o terceiro. O KV cache cresce linearmente com contexto e concorrência, sendo a causa primária de erros de OOM e o impulsionador oculto de custos. Em clusters cobrados por uptime de nó (como AKS), GPU ociosa é capital queimado. Por isso disciplina de tokens e de context length virou disciplina de FinOps.

O que mudou no cenário de zero-days segundo o GTIG?
O Google Threat Intelligence Group rastreou 90 zero-days explorados in-the-wild em 2025. O dado estrutural não é o volume, mas o alvo: 43 falhas (48%) atingiram tecnologias enterprise — recorde histórico —, com 21 delas em dispositivos de borda como roteadores e firewalls, que raramente têm EDR. Os Commercial Surveillance Vendors superaram grupos estatais em zero-days atribuídos, e o exploit kit Coruna, com 23 exploits para iOS, mostrou como capacidades antes restritas a Estados chegam ao cibercrime financeiro. A defesa é arquitetural: hardening de borda, MFA forte (FIDO2) e SBOM atualizado.


Fontes:

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset