A complexidade das telecomunicações modernas está atingindo níveis sem precedentes. As operadoras (CSPs) não gerenciam mais redes estáticas e isoladas; elas orquestram ecossistemas massivos e multicamadas que abrangem desde o acesso de rádio 5G (RAN) e fibras de transporte até o edge compute e cores de nuvem centralizados.
Para gerenciar essa complexidade, as empresas estão construindo redes autônomas — infraestruturas de telecomunicações que se autogerenciam utilizando AI, machine learning e automação de malha fechada (closed-loop) para se autoconfigurar, otimizar, recuperar e proteger com intervenção humana mínima. De acordo com o framework de redes autônomas do Google Cloud, um componente crítico para essa evolução é o digital twin de alta fidelidade e em tempo real. A partir dele, é possível aplicar técnicas avançadas de graph machine learning (GraphML), como as graph neural networks (GNNs), para analisar, prever e remediar proativamente problemas na rede produtiva.
Essa abordagem não é nova para o Google. É a mesma filosofia arquitetural usada para gerenciar sua rede de escala planetária e sistemas complexos como a tecnologia de carros autônomos da Waymo. O GraphML permite isso ao compreender a geometria do ambiente e as relações entre os objetos, possibilitando decisões autônomas seguras. Por meio de uma colaboração estratégica com a NetAI, provedora de soluções de AIOps baseadas em GraphML, essa inteligência consciente de relacionamentos chega agora ao setor de telecomunicações. Na Mobile World Congress (MWC) 2026, a operadora espanhola MasOrange apresentará uma Prova de Conceito (PoC) que explora esse conceito como caminho para um AIOps totalmente gerenciado.
A base do digital twin: Modelagem da sua rede
O primeiro passo para construir uma rede autônoma é migrar de um inventário estático para um digital twin dinâmico.
Modelos operacionais tradicionais dependem de data lakes fragmentados, onde a topologia é tratada apenas como mais uma tabela. No framework proposto, utiliza-se o Spanner Graph para construir um digital twin dinâmico, modelando explicitamente as relações e a topologia da rede em tempo real. Esse twin captura bilhões de dependências — mapeando exatamente como um transponder óptico específico suporta uma interface IP, que por sua vez sustenta um slice 5G de um cliente corporativo.
Essa estrutura de grafo não serve apenas para visualização; ela fornece o contexto topológico fundamental para alimentar modelos avançados de AI baseados em GNN.
GNNs vs. ML Tradicional
Durante anos, a indústria aplicou machine learning (ML) tradicional às operações de rede, muitas vezes com resultados mistos. Para entender por que as GNNs são superiores para redes autônomas, precisamos observar como elas tratam os dados em comparação aos métodos legados.
Algoritmos de ML padrão, como random forests e deep learning básico, geralmente interpretam dados de rede como vetores planos e simplificados ou sequências de time-series desconectadas. Essa perspectiva resulta em modelos que:
- São cegos à topologia: Modelos padrão não entendem inerentemente a topologia. Eles não "sabem" que o Roteador A está conectado ao Switch B, o que significa que perdem a característica mais importante de uma falha de rede: a propagação.
- Baseiam-se em sintomas: Modelos tradicionais de ML são excelentes para detectar que uma métrica sofreu um pico (anomaly detection), mas têm dificuldade em entender o porquê.
- Detectam correlação, não causalidade: Esses modelos dependem de correlação estatística. Se o uso de CPU sobe ao mesmo tempo que ocorre um packet loss, eles assumem um vínculo. Contudo, em redes complexas, a correlação é frequentemente coincidência ou sintoma downstream de uma falha distante.
As GNNs são fundamentalmente diferentes porque são conscientes da estrutura. Isso possibilita:
- Processamento nativo de topologia: As GNNs ingerem o grafo da rede diretamente. Elas não olham apenas para os dados nos nós; elas processam as conexões entre eles.
- Raciocínio determinístico: Em vez de suposições estatísticas, as GNNs usam message passing. Se ocorre um corte de fibra, o modelo propaga matematicamente esse "sinal de falha" pelos caminhos físicos conhecidos no digital twin para prever exatamente quais serviços de camadas superiores falharão.
- Detecção precisa de anomalias: Ao entender as relações entre vizinhos, uma GNN pode distinguir entre uma anomalia local (um roteador instável) e uma anomalia estrutural (falha em um subgrafo), reduzindo drasticamente os falsos positivos.
NetAI GNN no Google Autonomous Network stack

A stack tecnológica: Google tf-GNN e NetAI
A PoC da MasOrange é uma exploração de GraphML, integrando a infraestrutura do Google com a expertise de domínio da NetAI.
- Biblioteca Google tf-GNN: O Google desenvolveu e abriu o código da TensorFlow GNN (tf-GNN), uma biblioteca testada em produção para construir GNNs em escala massiva. É a mesma classe de modelagem usada para analisar estruturas de grafos complexas nos próprios produtos do Google.
- Ajuste fino (Fine-tuning) da NetAI: A NetAI explorou esses modelos de tf-GNN e, em colaboração com o Google, desenvolveu modelos avançados significativamente mais adaptados para o caso de uso de telecomunicações. Os modelos compreendem comportamentos específicos, como distinguir entre BGP session flaps, degradação de sinal óptico e latência induzida por congestionamento.
- AIOps Gerenciado: A NetAI encapsula esses modelos em uma plataforma totalmente gerenciada que cuida do ciclo de vida ponta a ponta, desde a descoberta automatizada da rede e construção do grafo até a análise final de causa raiz (root cause analysis).
Perspectivas Executivas
"À medida que escalamos nossas operações, a habilidade de identificar causas raiz em milhões de componentes interconectados não é mais opcional. A parceria com Google Cloud e NetAI nesta abordagem baseada em GraphML nos permite transformar nossa observabilidade em um motor proativo para confiabilidade de serviço." — Roberto González Librán, Head de Observabilidade e Automação na MasOrange.
"Nosso framework de redes autônomas foi desenhado para lidar com as intensas demandas de dados das operadoras modernas. Ao integrar capacidades de GraphML com parceiros como a NetAI, fornecemos o raciocínio determinístico necessário para rodar redes verdadeiramente autônomas e self-healing." — Muninder Sambi, VP & GM de Networking no Google Cloud.
Próximos Passos
A transição para redes autônomas exige mais do que monitoramento aprimorado; exige uma mudança fundamental na forma como modelamos e raciocinamos sobre a infraestrutura. Para empresas brasileiras que operam infraestruturas complexas, a adoção de digital twins e GNNs representa o fim da era do "troubleshooting baseado em tentativa e erro" e o início da eficiência operacional orientada por dados estruturais.
Artigo originalmente publicado por NetAI em Cloud Blog.