TL;DR: A Microsoft estende o Azure Local para hardware de formato reduzido (ex.: ASUS NUC, Lenovo ThinkEdge), rodando Linux em bare metal com containers. O Foundry Local agora roda como container em dispositivos edge, com inferência local sem latência de rede. AKS e Azure IoT Operations são validados nesse novo formato. Empresas brasileiras podem levar inteligência a robôs e sistemas físicos de forma gerenciada e escalável, com preview gratuito.
Escrito por Cosmos Darwin, Azure Edge PM, e Michael MacKenzie, VP de Operações Digitais.
A IA está transformando o trabalho, mas até agora ela vive quase exclusivamente na tela: agentes e modelos ajudando com trabalho de informação. Como levar essa inteligência para o trabalho físico? Tarefas como transportar mercadorias, inspecionar equipamentos, fabricar produtos ou atender clientes no varejo. Isso já é possível, mas desenvolver robôs autônomos continua sendo complexo e especializado. O verdadeiro salto virá quando usar IA em trabalho físico for tão simples e ubíquo quanto na tela. Para chegar lá, precisamos ir além de agentes de software e incorporar inteligência diretamente nos sistemas físicos.
Hoje, no Microsoft Build 2026, a Microsoft anunciou várias capacidades novas para ajudar organizações a começar. Estão estendendo a infraestrutura gerenciada do Azure preparada para IA para hardware de formato reduzido, trazendo o Foundry Local para executar agentes e modelos de IA localmente, além de adicionar suporte ao Azure Kubernetes Service e ao Azure IoT Operations.
Demo: um robô simples que pensa por si
Aplicadas em conjunto, essas capacidades podem ser surpreendentemente poderosas. A equipe montou um robô agêntico básico usando apenas modelos open-source, sensores e hardware de robô comerciais, e as novas previews do Azure. Um exemplo lúdico, mas que ilustra o que é possível:
Deployments leves em hardware de formato reduzido (preview)
Primeiro, a Microsoft está estendendo o provisionamento e gerenciamento baseados no Azure para hardwares menores, usando uma arquitetura leve e orientada a performance para cargas de IA. Diferente de implantações hiperconvergentes ou disaggregated, essa abordagem não depende de virtualização: roda Linux (inicialmente Azure Linux) diretamente em bare metal para hospedar containers. Você pode escolher ferramentas de runtime como Docker, k3s open-source ou o Azure Kubernetes Service totalmente gerenciado.
Cada deployment é provisionado e gerenciado da nuvem usando um novo tipo de recurso chamado Provisioned Machine, que se comporta como uma VM do Azure – você vê no portal, governa acesso com Microsoft Entra ID. Nos próximos meses, mais funcionalidades serão liberadas: gerenciamento de atualizações, métricas, configuração de segurança e recursos filho configuráveis nativamente para interfaces de rede e discos.
As Provisioned Machines suportam operações de lifecycle centralizadas do portal e APIs do Azure. Efetivamente, você trata máquinas físicas como recursos cloud, eliminando a necessidade de ferramentas locais de TI. Para uma empresa como a Chevron, com operações em campos ao redor do mundo, isso é significativo:
"Chevron tem uma frota crescente de dispositivos edge industriais que coletam dados em campo e cada vez mais processam IA localmente. Tecnologias como o Azure Local em formatos menores podem nos ajudar a gerenciar esses sistemas centralmente e de forma mais automatizada – reduzindo a complexidade em comparação com ambientes OS customizados." — Ed Moore, OT Strategist and Distinguished Engineer, Chevron
Execute agentes e modelos localmente com Foundry Local (preview)
Para incorporar inteligência em sistemas físicos, o Foundry Local agora está disponível como uma imagem de container leve para Linux.
O Foundry Local fornece uma maneira consistente de implantar e executar agentes e modelos, incluindo um servidor de inferência que roda ao lado do seu container de aplicação e expõe um endpoint REST compatível com OpenAI. Ele também oferece uma fonte confiável de modelos open-source atualizados com um catálogo online extenso. Embora se integre com o Microsoft Foundry, em tempo de execução tudo fica local: não há round-trip para a nuvem. Os dados permanecem na máquina, as respostas começam instantaneamente com zero latência de rede e as inferências continuam mesmo sem conectividade. Também não há custos por token.
Otimizado para formatos edge e industriais, o Foundry Local detecta e usa automaticamente aceleradores disponíveis como GPUs (e em breve NPUs), alinhando toda a stack – de drivers de kernel a bibliotecas user-mode. No demo acima, o Foundry Local utiliza uma GPU Nvidia RTX 2000E para inferências rápidas em tempo real.
Mais serviços populares do Azure
Além do Foundry Local, estes serviços Azure também são validados:
Azure Kubernetes Service (AKS) – o serviço Kubernetes gerenciado enterprise agora roda diretamente em bare metal com implantações de formato reduzido, sem camada de virtualização. É o mesmo AKS disponível na nuvem e em servidores. Uma vez implantado, o cluster funciona exatamente como AKS em qualquer outro lugar – com RBAC baseado no Azure, networking, upgrades, monitoramento e integrações como AKS Fleet Manager. Os controles e ferramentas que você usa na nuvem se estendem até o edge industrial. Saiba mais e participe da preview do AKS
Azure IoT Operations – fornece um plano de dados e controle unificado para ativos físicos no edge. Inclui vários conectores e um broker MQTT industrial onde agentes e lógica locais podem rodar – mesmo com conectividade intermitente – para transformar dados operacionais em formas prontas para IA, agir autonomamente e conectar-se a sistemas mais amplos de analytics e IA na nuvem. Possui interface gráfica no-code para configurar fluxos de dados e contextualizá-los antes de enviá-los para destinos como o Microsoft Fabric para Real-Time Intelligence. Já está GA e agora funciona também em implantações de formato reduzido. Saiba mais sobre Azure IoT Operations
Escolha o hardware que atende aos seus requisitos
A Microsoft está em parceria com os principais fabricantes de computadores edge e industriais para que você possa implantar infraestrutura gerenciada pelo Azure em hardware de formato reduzido disponível hoje – direto de seu fornecedor ou distribuidor, sem customização especial.
As opções mais compactas e acessíveis são o ASUS NUC 14 Pro e 15 Pro. Com apenas 4 polegadas quadradas e menos de 2 libras, eles trazem os processadores Intel Core Ultra mais recentes em um pacote enxuto, ideal para cenários com espaço limitado como varejo. Saiba mais sobre o NUC 15 Pro
"Com ASUS NUC 14 Pro e 15 Pro, as organizações têm uma plataforma poderosa, porém compacta, para inovação no edge. Quando combinados com o Azure Local, esses dispositivos facilitam a implantação, gerenciamento e escalabilidade de workloads de IA no edge – liberando inteligência em tempo real para lojas de varejo e ambientes de manufatura, mantendo integração perfeita com a nuvem." – KuoWei Chao, General Manager, ASUS NUC Business Unit
Para mais flexibilidade, o Lenovo ThinkEdge SE100, de nível industrial, oferece armazenamento e rede expansíveis, além de GPU Nvidia RTX A1000 (8GB) ou 2000E (16GB) opcional para acelerar inferência de IA no edge. Saiba mais sobre ThinkEdge SE100
Para as restrições operacionais e regulatórias mais severas, o OnLogic Helix 521 tem design sem ventoinha e sem partes móveis. Projetado, montado e suportado inteiramente nos EUA, elimina incertezas em cadeias de suprimento rigorosas. Saiba mais sobre o Hx521
Comece hoje
Implantações de formato reduzido estão disponíveis em public preview a partir de hoje, começando na região East US. Não há cobrança durante a preview. Assim que o hardware estiver pronto, o provisionamento via Azure leva a maioria dos previewers a ficar operacional em cerca de uma hora. Instruções no Microsoft Learn e, se quiser contato direto com o time, entre em contato. (Se precisar avaliar antes de comprar hardware, é possível subir em uma VM, embora não seja igual ao hardware real.)
Perguntas Frequentes
-
Quais hardwares são compatíveis com essa preview?
ASUS NUC 14 Pro e 15 Pro, Lenovo ThinkEdge SE100 com GPU Nvidia opcional e OnLogic Helix 521 (fan-less, fabricado nos EUA). Todos podem ser adquiridos diretamente sem customização especial. -
Como o Foundry Local funciona sem conexão com a nuvem?
Foundry Local é uma imagem de container Linux que inclui um servidor de inferência com endpoint REST compatível com OpenAI. Toda execução é local: dados não saem do dispositivo, respostas são instantâneas e inferências continuam mesmo offline, sem custo por token. -
A preview tem custo?
Não. Durante o período de public preview não há cobrança. O provisionamento via Azure portal leva cerca de uma hora após o hardware estar pronto. Disponível inicialmente na região East US. -
Quais serviços do Azure são suportados nesse novo formato?
Além do Foundry Local, o Azure Kubernetes Service (AKS) roda diretamente em bare metal sem virtualização, com as mesmas APIs e ferramentas de gerenciamento. O Azure IoT Operations também é validado, fornecendo um broker MQTT e conectores para dados operacionais. -
Como testar sem adquirir hardware físico?
É possível simular o ambiente em uma máquina virtual, embora a Microsoft recomende o hardware real para resultados mais próximos da produção. As instruções completas estão no Microsoft Learn.
Artigo originalmente publicado por Cosmos Darwin e Michael MacKenzie em Azure Updates - Latest from Azure Charts.
