2 de junho de 20268 min de leitura

Inteligência incorporada em sistemas físicos: infraestrutura de menor formato para edge AI (preview)

Cosmos Darwin e Michael MacKenzie

Azure

Banner - Inteligência incorporada em sistemas físicos: infraestrutura de menor formato para edge AI (preview)

TL;DR: A Microsoft estende o Azure Local para hardware de formato reduzido (ex.: ASUS NUC, Lenovo ThinkEdge), rodando Linux em bare metal com containers. O Foundry Local agora roda como container em dispositivos edge, com inferência local sem latência de rede. AKS e Azure IoT Operations são validados nesse novo formato. Empresas brasileiras podem levar inteligência a robôs e sistemas físicos de forma gerenciada e escalável, com preview gratuito.

Escrito por Cosmos Darwin, Azure Edge PM, e Michael MacKenzie, VP de Operações Digitais.

A IA está transformando o trabalho, mas até agora ela vive quase exclusivamente na tela: agentes e modelos ajudando com trabalho de informação. Como levar essa inteligência para o trabalho físico? Tarefas como transportar mercadorias, inspecionar equipamentos, fabricar produtos ou atender clientes no varejo. Isso já é possível, mas desenvolver robôs autônomos continua sendo complexo e especializado. O verdadeiro salto virá quando usar IA em trabalho físico for tão simples e ubíquo quanto na tela. Para chegar lá, precisamos ir além de agentes de software e incorporar inteligência diretamente nos sistemas físicos.

Hoje, no Microsoft Build 2026, a Microsoft anunciou várias capacidades novas para ajudar organizações a começar. Estão estendendo a infraestrutura gerenciada do Azure preparada para IA para hardware de formato reduzido, trazendo o Foundry Local para executar agentes e modelos de IA localmente, além de adicionar suporte ao Azure Kubernetes Service e ao Azure IoT Operations.

Demo: um robô simples que pensa por si

Aplicadas em conjunto, essas capacidades podem ser surpreendentemente poderosas. A equipe montou um robô agêntico básico usando apenas modelos open-source, sensores e hardware de robô comerciais, e as novas previews do Azure. Um exemplo lúdico, mas que ilustra o que é possível:

Vídeo demonstrativo do robô agêntico

Deployments leves em hardware de formato reduzido (preview)

Primeiro, a Microsoft está estendendo o provisionamento e gerenciamento baseados no Azure para hardwares menores, usando uma arquitetura leve e orientada a performance para cargas de IA. Diferente de implantações hiperconvergentes ou disaggregated, essa abordagem não depende de virtualização: roda Linux (inicialmente Azure Linux) diretamente em bare metal para hospedar containers. Você pode escolher ferramentas de runtime como Docker, k3s open-source ou o Azure Kubernetes Service totalmente gerenciado.

Cada deployment é provisionado e gerenciado da nuvem usando um novo tipo de recurso chamado Provisioned Machine, que se comporta como uma VM do Azure – você vê no portal, governa acesso com Microsoft Entra ID. Nos próximos meses, mais funcionalidades serão liberadas: gerenciamento de atualizações, métricas, configuração de segurança e recursos filho configuráveis nativamente para interfaces de rede e discos.

Screenshot do novo recurso Provisioned Machine no portal Azure

As Provisioned Machines suportam operações de lifecycle centralizadas do portal e APIs do Azure. Efetivamente, você trata máquinas físicas como recursos cloud, eliminando a necessidade de ferramentas locais de TI. Para uma empresa como a Chevron, com operações em campos ao redor do mundo, isso é significativo:

"Chevron tem uma frota crescente de dispositivos edge industriais que coletam dados em campo e cada vez mais processam IA localmente. Tecnologias como o Azure Local em formatos menores podem nos ajudar a gerenciar esses sistemas centralmente e de forma mais automatizada – reduzindo a complexidade em comparação com ambientes OS customizados." — Ed Moore, OT Strategist and Distinguished Engineer, Chevron

Execute agentes e modelos localmente com Foundry Local (preview)

Para incorporar inteligência em sistemas físicos, o Foundry Local agora está disponível como uma imagem de container leve para Linux.

O Foundry Local fornece uma maneira consistente de implantar e executar agentes e modelos, incluindo um servidor de inferência que roda ao lado do seu container de aplicação e expõe um endpoint REST compatível com OpenAI. Ele também oferece uma fonte confiável de modelos open-source atualizados com um catálogo online extenso. Embora se integre com o Microsoft Foundry, em tempo de execução tudo fica local: não há round-trip para a nuvem. Os dados permanecem na máquina, as respostas começam instantaneamente com zero latência de rede e as inferências continuam mesmo sem conectividade. Também não há custos por token.

Otimizado para formatos edge e industriais, o Foundry Local detecta e usa automaticamente aceleradores disponíveis como GPUs (e em breve NPUs), alinhando toda a stack – de drivers de kernel a bibliotecas user-mode. No demo acima, o Foundry Local utiliza uma GPU Nvidia RTX 2000E para inferências rápidas em tempo real.

Diagrama da arquitetura Linux leve com serviços Azure em container

Mais serviços populares do Azure

Além do Foundry Local, estes serviços Azure também são validados:

Azure Kubernetes Service (AKS) – o serviço Kubernetes gerenciado enterprise agora roda diretamente em bare metal com implantações de formato reduzido, sem camada de virtualização. É o mesmo AKS disponível na nuvem e em servidores. Uma vez implantado, o cluster funciona exatamente como AKS em qualquer outro lugar – com RBAC baseado no Azure, networking, upgrades, monitoramento e integrações como AKS Fleet Manager. Os controles e ferramentas que você usa na nuvem se estendem até o edge industrial. Saiba mais e participe da preview do AKS

Azure IoT Operations – fornece um plano de dados e controle unificado para ativos físicos no edge. Inclui vários conectores e um broker MQTT industrial onde agentes e lógica locais podem rodar – mesmo com conectividade intermitente – para transformar dados operacionais em formas prontas para IA, agir autonomamente e conectar-se a sistemas mais amplos de analytics e IA na nuvem. Possui interface gráfica no-code para configurar fluxos de dados e contextualizá-los antes de enviá-los para destinos como o Microsoft Fabric para Real-Time Intelligence. Já está GA e agora funciona também em implantações de formato reduzido. Saiba mais sobre Azure IoT Operations

Escolha o hardware que atende aos seus requisitos

A Microsoft está em parceria com os principais fabricantes de computadores edge e industriais para que você possa implantar infraestrutura gerenciada pelo Azure em hardware de formato reduzido disponível hoje – direto de seu fornecedor ou distribuidor, sem customização especial.

Parceiros de hardware: ASUS, Lenovo, OnLogic

As opções mais compactas e acessíveis são o ASUS NUC 14 Pro e 15 Pro. Com apenas 4 polegadas quadradas e menos de 2 libras, eles trazem os processadores Intel Core Ultra mais recentes em um pacote enxuto, ideal para cenários com espaço limitado como varejo. Saiba mais sobre o NUC 15 Pro

"Com ASUS NUC 14 Pro e 15 Pro, as organizações têm uma plataforma poderosa, porém compacta, para inovação no edge. Quando combinados com o Azure Local, esses dispositivos facilitam a implantação, gerenciamento e escalabilidade de workloads de IA no edge – liberando inteligência em tempo real para lojas de varejo e ambientes de manufatura, mantendo integração perfeita com a nuvem." – KuoWei Chao, General Manager, ASUS NUC Business Unit

Para mais flexibilidade, o Lenovo ThinkEdge SE100, de nível industrial, oferece armazenamento e rede expansíveis, além de GPU Nvidia RTX A1000 (8GB) ou 2000E (16GB) opcional para acelerar inferência de IA no edge. Saiba mais sobre ThinkEdge SE100

Para as restrições operacionais e regulatórias mais severas, o OnLogic Helix 521 tem design sem ventoinha e sem partes móveis. Projetado, montado e suportado inteiramente nos EUA, elimina incertezas em cadeias de suprimento rigorosas. Saiba mais sobre o Hx521

Comece hoje

Implantações de formato reduzido estão disponíveis em public preview a partir de hoje, começando na região East US. Não há cobrança durante a preview. Assim que o hardware estiver pronto, o provisionamento via Azure leva a maioria dos previewers a ficar operacional em cerca de uma hora. Instruções no Microsoft Learn e, se quiser contato direto com o time, entre em contato. (Se precisar avaliar antes de comprar hardware, é possível subir em uma VM, embora não seja igual ao hardware real.)


Perguntas Frequentes

  • Quais hardwares são compatíveis com essa preview?
    ASUS NUC 14 Pro e 15 Pro, Lenovo ThinkEdge SE100 com GPU Nvidia opcional e OnLogic Helix 521 (fan-less, fabricado nos EUA). Todos podem ser adquiridos diretamente sem customização especial.

  • Como o Foundry Local funciona sem conexão com a nuvem?
    Foundry Local é uma imagem de container Linux que inclui um servidor de inferência com endpoint REST compatível com OpenAI. Toda execução é local: dados não saem do dispositivo, respostas são instantâneas e inferências continuam mesmo offline, sem custo por token.

  • A preview tem custo?
    Não. Durante o período de public preview não há cobrança. O provisionamento via Azure portal leva cerca de uma hora após o hardware estar pronto. Disponível inicialmente na região East US.

  • Quais serviços do Azure são suportados nesse novo formato?
    Além do Foundry Local, o Azure Kubernetes Service (AKS) roda diretamente em bare metal sem virtualização, com as mesmas APIs e ferramentas de gerenciamento. O Azure IoT Operations também é validado, fornecendo um broker MQTT e conectores para dados operacionais.

  • Como testar sem adquirir hardware físico?
    É possível simular o ambiente em uma máquina virtual, embora a Microsoft recomende o hardware real para resultados mais próximos da produção. As instruções completas estão no Microsoft Learn.


Artigo originalmente publicado por Cosmos Darwin e Michael MacKenzie em Azure Updates - Latest from Azure Charts.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset