2 de junho de 2026•17 min de leitura

Construa e execute agentes em escala com o Microsoft Foundry: o que a Build 2026 revelou sobre produção real de agentes de IA

TL;DR: A Microsoft Foundry apresentou na Build 2026 uma plataforma unificada para agentes de IA que cobre desde o desenvolvimento (Agent Framework, Toolboxes, memória procedural) até a operação (tracing, avaliação, agente otimizador). Para empresas brasileiras que enfrentam os mesmos gargalos de integração, isolamento e observabilidade que os microserviços enfrentaram há uma década, a mensagem é clara: o desafio real está na orquestração e governança pós-prototipação. O artigo analisa cada camada e sugere pontos de atenção para adoção no mercado local.

Desenvolvedores já estão construindo agentes, e os ganhos de produtividade iniciais são inegáveis. Com coding agents como o GitHub Copilot, montar um protótipo funcional é a parte fácil. O difícil começa depois que o agente sai do laptop e precisa operar dentro de um workflow empresarial. Cada ferramenta e fonte de dados vira uma integração distinta — com fluxo de autenticação, protocolo e ciclo de vida próprios. Ancorar o agente em conhecimento corporativo exige construir um pipeline de RAG do zero. Executar o agente em produção é outro problema: você precisa de isolamento entre sessões, estado durável e um runtime que aguente carga real. E quando está no ar, você não enxerga o que acontece — traces param na fronteira do agente, avaliações são manuais, e não há um caminho de “isso falhou em prod” para “aqui está uma versão corrigida”. Esse é o mesmo ponto de inflexão que os microserviços atingiram uma década atrás: um serviço único é fácil; tudo ao redor (descoberta, isolamento, observabilidade, deployment) é onde o trabalho real mora. Os agentes estão nesse ponto agora.

A Microsoft Agent Platform foi construída para esse trabalho — construir no GitHub, executar no Foundry e alcançar usuários onde eles já estão. Na Build 2026, a Microsoft entregou uma plataforma conectada no Microsoft Foundry em três camadas:

Build: atualizações do Microsoft Agent Framework, suporte a skills via Toolboxes no Foundry, memória procedural e integração Voice Live — para que desenvolvedores permaneçam na IDE e nos frameworks que já usam.
Deploy: agentes hospedados no Foundry Agent Service, agentes de longa duração e routines, publicação para Microsoft Teams e Microsoft 365 Copilot — para que qualquer agente chegue aos apps que seus usuários já abrem.
Operate: tracing e avaliação para agentes hospedados e Agent Optimizer no Foundry Agent Service — um loop fechado que transforma falhas de produção em melhorias ranqueadas e revisáveis.

Build: framework, ferramentas e memória

Construir agentes hoje não é mais sobre fazer um protótipo funcionar — é sobre fazer as escolhas arquiteturais certas desde o início.

Framework: o harness

Agentes de produção não devem forçar uma escolha de framework upfront. O Microsoft Foundry trata o agent harness como um ponto flexível, não um lock-in: investimentos em LangGraph, GitHub Copilot SDK ou Claude Agent SDK são preservados. Se você está começando do zero, o Microsoft Agent Framework é o framework opinado e open-source, estável em Python e .NET. Ele unifica as bases empresariais do Semantic Kernel com a orquestração multi-agente do AutoGen — você não precisa mais escolher entre eles. As atualizações incluem:

Agent harness com skills, memória e middleware (versão estável)
Integrações com GitHub Copilot SDK e Claude Agent SDK (estável)
Padrões de orquestração multi-agente incluindo Magentic-One (estável)
File system tools, memory tools e deep research agent (public preview)

“O desenvolvimento e a integração do modelo de dados móveis dentro dos serviços Azure nos colocaram em posição privilegiada para acelerar o programa de transformação de otimização de redes. O Foundry Agent Service e o Microsoft Agent Framework viabilizam soluções de IA embarcadas tanto dentro quanto sobre redes móveis — essenciais para o desenvolvimento futuro de redes 6G.” — Jaime Lluch, Head of Mobile Network Technology & Optimization, Telefónica Spain

Tudo compõe localmente. O Foundry Toolkit for VS Code (GA) é a experiência de desenvolvedor dedicada sem sair do editor: crie agentes a partir de templates ou com o GitHub Copilot, teste e debugue execuções localmente com visualização completa de traces, inspecione o comportamento do agente passo a passo, conecte-se a Toolboxes e faça deploy diretamente para o Foundry Agent Service — tudo do VS Code.

Ferramentas: como os agentes agem

Ferramentas são como agentes fazem coisas — chamar APIs, pesquisar documentos, executar código, conversar com outros agentes. A maioria dos agentes falha nessa camada muito antes de falhar em raciocínio. Cada ferramenta introduz diferenças em protocolo, autenticação e gerenciamento de ciclo de vida, aumentando a sobrecarga de integração.

Toolboxes in Foundry (public preview) dá ao seu agente um único endpoint gerenciado para cada tipo de ferramenta. Configure ferramentas uma vez, aponte qualquer cliente MCP para uma URL e deixe o Foundry cuidar de auth, ciclo de vida e governança. Skills (preview) agora são cidadãs de primeira classe — versionadas em um catálogo por projeto e descobertas como recursos MCP por qualquer agente no projeto. Tool search (preview) está disponível em Toolboxes para selecionar inteligentemente as ferramentas certas por tarefa, em vez de expor todas ao modelo. O Toolbox também se conecta ao Microsoft IQ — incluindo Web IQ, Work IQ (preview), Fabric IQ (preview) com Fabric data agent, Ontology e modelos semânticos, e Foundry IQ — para que agentes acessem dados corporativos sem plumberia customizada. Além do Toolboxes, o Foundry IQ agora está geralmente disponível como camada de conhecimento dedicada por trás dos agentes Foundry, unificando Work IQ, Fabric IQ, Azure SQL, File Search e fontes MCP em um único endpoint de recuperação com SLA, com um tier Serverless em public preview e Web IQ para grounding abaixo de 200ms.

Explore sample codes for Microsoft Agent Framework + Toolbox.

Multimodal: olhos e voz para o agente

Agentes de produção precisam ler documentos e falar em tempo real, não apenas chamar endpoints.

O Azure Content Understanding (ACU) é uma camada unificada de conteúdo que simplifica como aplicações analisam, classificam e extraem informações de documentos, imagens e mais — seja identificando campos estruturados em documentos digitais, lendo manuscritos e assinaturas de imagens, ou extraindo dados chave de faturas scaneadas de baixa qualidade, tudo com redução significativa de custos de tokens. Na Build, o ACU adiciona analisadores pré-construídos agora disponíveis no Microsoft Foundry, facilitando a integração com outros modelos e workflows do Foundry. Desenvolvedores podem aproveitar suporte aos modelos GPT mais recentes, junto com integrações perfeitas com Microsoft Agent Framework, LangChain e Logic Apps para acelerar automação ponta a ponta. No próximo mês, o ACU introduz agentic mode em preview, permitindo workflows de documentos em múltiplas etapas com orquestração mínima, junto com APIs síncronas de leitura e layout e um conjunto expandido de analisadores pré-construídos projetados para reduzir custos de tokens em mais de 80%.

“Ao incorporar o Azure Content Understanding no DataSnipper, estamos transformando documentos não estruturados em dados estruturados e acionáveis — diretamente no Excel. Juntos, estamos possibilitando revisões mais rápidas, evidências confiáveis e IA em que se pode confiar.” — Vidya Peters, CEO, DataSnipper

“Ao integrar o Content Understanding em nossas soluções, nossos clientes transformam dados complexos e não estruturados em insights acionáveis — mais rápido e com mais precisão. O resultado são workflows simplificados, menos esforço manual e valor de negócio claro e mensurável da IA.” — Adam Orentlicher, SVP CTO, Wolters Kluwer

O Voice Live unifica reconhecimento de fala, texto-para-fala, detecção de turno, tratamento de interrupções, avatares e outros recursos de conversação em tempo real em uma única API.

Para equipes construindo com prompt agents, o Voice Live agora está geralmente disponível como o caminho mais rápido para adicionar experiências de voz em tempo real. Capacidades existentes do agente — incluindo tool calling, conhecimento, memória, guardrails e integrações corporativas — continuam funcionando perfeitamente, agora aprimoradas com interações de fala de baixa latência. Para equipes que precisam de controle total sobre seu runtime de agente e framework de orquestração, hosted agents com Voice Live está em public preview. Desenvolvedores podem construir com os frameworks que preferirem — Microsoft Agent Framework, LangChain ou uma pilha de orquestração customizada — hospedar no Foundry Agent Service e conectar diretamente ao Voice Live para uma experiência de voz fluida.

“Integrado ao Foundry Agent Service e Voice Live, a capacidade conversacional em tempo real permite que executivos, incluindo o CEO, liderança e gestão operacional, falem naturalmente e recebam respostas faladas imediatas e precisas, com base em dados operacionais ao vivo.” — Ahmed Naeemi, Chief Information Officer, Technology and Digital Services, Gulf Air

Memória: contexto de longo prazo entre sessões

Ferramentas permitem que agentes ajam. Memória faz com que essas ações sejam informadas e melhorem com o tempo. A memória no Foundry Agent Service (public preview) agora inclui três tipos:

Procedural memory (novo na Build, em public preview) – agentes aprendem como fazer o trabalho entre execuções, não apenas o que foi dito. Resultados iniciais no Tau-bench mostram ganhos de +7 a 14% na taxa de sucesso com custo próximo ao baseline.
User memory — lembra preferências e fatos entre sessões (ex.: “usuário é alérgico a laticínios”)
Session memory — mantém contexto dentro de um thread de conversa

Com a nova memória procedural, um desenvolvedor usando um agente de code review o instrui uma vez: “Verifique a cobertura de testes primeiro, depois sinalize novas dependências, então procure por mudanças de API que quebram compatibilidade.” Semanas depois, em um PR diferente, o agente executa as mesmas três verificações na mesma ordem — sem re-instrução.

Deploy: runtime, distribuição, interoperabilidade

Seu agente funciona localmente. Agora ele precisa de um lar de produção — um runtime que isole código não confiável, protocolos que permitam que agentes conversem com outros agentes e um caminho para os apps que seus usuários abrem todos os dias.

Runtime: execução isolada para agentes de produção

Hosted agents no Foundry Agent Service (atingindo disponibilidade geral nos próximos 30 dias) é o runtime gerenciado para agentes de produção. Cada sessão executa em seu próprio sandbox, isolando cada execução de agente com compute, memória e filesystem dedicados. O runtime é framework-agnostic, então agentes construídos com Microsoft Agent Framework, GitHub Copilot SDK, LangGraph ou outros SDKs podem ser deployados sem reescrita. Dois protocolos são suportados: Responses API para interações stateful compatíveis com OpenAI, e o Invocations protocol para cenários pass-through sem esquema fixo, onde você controla o formato da requisição e resposta. Explore sample codes with Microsoft Agent Framework.

Mas agentes de produção não apenas respondem a chat — eles executam continuamente, mantêm estado e agem por conta própria. Hosted agents agora suportam agentes autônomos de longa duração como OpenClaw e Hermes com estado durável e acesso a sistema de arquivos, e routines (public preview) para operacionalizar qualquer agente em um timer ou cronograma. Imagine um agente que monitora um repositório GitHub durante a noite, tria novas issues pela manhã e posta um resumo no Teams antes da daily.

“Hosted agents no Foundry Agent Service usam um design framework-agnostic e invocação flexível para permitir que desenvolvedores implantem o Twilio Agent Connect diretamente em seu runtime serverless. Startup rápido viabiliza casos de uso de voz em tempo real sensíveis a latência, e custo zero em idle se adequa a conversas de mensagens onde as respostas podem levar horas.” — Ryan Rouleau, Staff Software Engineer, Twilio

“Hosted agents no Foundry Agent Service fornecerão à KPMG a flexibilidade, observabilidade e controle necessários para executar agentes em escala. Essa capacidade será um componente fundamental da plataforma global KPMG Workbench, permitindo que desenvolvedores construam soluções orientadas a agentes poderosas tanto para engajamentos com clientes quanto para casos de uso internos.” — Werner Vanzyl, Sr. Director, KPMG AI & Data Labs

Distribuição: agentes dentro dos apps que os usuários já abrem

Com a publicação para Microsoft Teams e Microsoft 365 Copilot (disponibilidade geral no próximo mês), qualquer agente Foundry pode ser implantado diretamente nas ferramentas que os funcionários já usam, com identidade, permissões e políticas fluindo automaticamente.

O Foundry já suporta duas formas de os agentes aparecerem no Microsoft 365: assistive agents que agem em nome do usuário dentro do Copilot ou chat, e autonomous agents que agem por conta própria em segundo plano — acionados por eventos ou schedules, sem superfície colaborativa. Na Build, a Microsoft está introduzindo uma terceira: autopilot agents (public preview). Esses agentes agem independentemente com Entra Agent ID, endereço de e-mail, presença no Microsoft Teams e lugar no organograma. Eles podem iniciar conversas, trabalhar em arquivos compartilhados, acompanhar itens de ação e colaborar com humanos ao longo do tempo. Toda ação é atribuível, auditável e governada via Agent 365 no Microsoft Admin Center. Para começar, clone o sample code e customiza para seu cenário — o Azure Developer CLI cuida de provisionamento, identidade e aprovação administrativa em um único workflow.

Interoperabilidade: colaboração cross-framework e cross-org

Agentes dentro da sua organização agora têm identidade e alcance. Mas agentes corporativos também precisam se conectar além dela — a agentes construídos por parceiros, fornecedores ou outras equipes em pilhas completamente diferentes. O Foundry suporta A2A (Agent2Agent) outbound — chamar agentes remotos como ferramenta — desde o lançamento da ferramenta A2A. Na Build, a Microsoft está adicionando a direção oposta: incoming A2A (public preview). Desenvolvedores agora podem expor qualquer agente Foundry como um endpoint A2A, e outros agentes o descobrem através de seu agent card e o invocam via protocolo aberto A2A, independentemente de framework ou cloud.

Operate: observabilidade e otimização

A maioria das equipes perde a confiança na camada de operação. Traces param na fronteira do agente. Avaliação é manual. Não há um caminho sistemático de “esse agente falhou” para “aqui está uma versão melhor”. O Foundry fecha essa lacuna com um loop conectado: observe o que está acontecendo, avalie o que importa e deixe a plataforma propor a próxima melhoria.

Observabilidade: tracing e avaliação ponta a ponta

Tracing e avaliação para hosted agents serão disponibilizados geralmente no final de junho de 2026. Cada chamada de modelo, invocação de ferramenta, salto de sub-agente e handoff flui através de um pipeline OpenTelemetry, e as avaliações se vinculam diretamente ao trace que as produziu no Foundry Control Plane. Quando uma regressão aparece, você vai do score ao trace de produção exato que a expôs, em vez de costurar a história em dashboards separados. Sem traces de produção e sinais de avaliação, não há nada para proteger, pontuar ou otimizar. Essa é a fundação sobre a qual tudo o mais se constrói.

“Hosted agents no Foundry Agent Service fornecem uma base de nível de produção para IA — combinando identidade, memória, segurança e observabilidade por design. Isso nos permite escalar sistemas de IA em operações críticas de energia com total controle e confiança.” — Xabier Muruaga, Global Head of AI and Data, Iberdrola

Sua empresa está saindo do protótipo de agente para produção? Conte com a Nuvem Online para projetar a arquitetura de observabilidade e governança que falta — com foco em estabilidade, escalabilidade e redução de riscos.

Otimização: um loop fechado de traces para agentes melhores

Melhorar um agente hoje é um ciclo de tentativa e erro: equipes fazem deploy, observam falhas, tentam um ajuste de prompt, publicam a correção e torcem para funcionar. O Agent Optimizer no Foundry Agent Service (chegando em public preview nos próximos 30 dias — inscreva-se aqui para private preview) substitui esse ciclo por um loop governado e baseado em evidências. Ele consome traces e avaliações de produção de hosted agents, gera candidatos de melhoria ranqueados entre prompts e skills, valida cada candidato contra seus cenários e restrições, e recomenda o vencedor com lineage completo, diffs, auditoria e rollback. Esse sinal vem de um pipeline de avaliação conectado:

ASSERT gera testes adversariais a partir de suas políticas e revela onde o agente falha
Agent Control Specification transforma esses riscos em guardrails de runtime acionáveis em entrada, modelo, estado, execução de ferramenta e saída
Rubric (public preview) define o que significa “bom” — gerando critérios de avaliação ponderados (sucesso da tarefa, tom, segurança, custo, latência) e pontuando cada execução contra eles

O Agent Optimizer executa um ciclo reflexivo observe → evaluate → optimize → deploy. Cada candidato é avaliado contra sua rubric e apresentado com comparações lado a lado — mostrando exatamente o que melhorou, o que regrediu e por quê. Uma vez promovido, novos traces alimentam a avaliação — um loop de melhoria contínua onde cada interação torna o agente mensuravelmente melhor.

“O Agent Optimizer é um passo vital para ajudar empresas a mover agentes de IA além do proof of concept e para a produção confiável. Ao reunir governança, observabilidade e melhoria contínua, ele ajuda organizações a reduzir alucinações, melhorar a segurança e avaliar e otimizar continuamente o desempenho do agente. À medida que essas capacidades continuam a evoluir — incluindo Context Engineering e AgentOps, uma das tecnologias centrais por trás do conceito Smart AI Agent® da NTT DATA — acreditamos que o Agent Optimizer terá um papel importante em permitir que líderes de negócios adotem IA agentiva em escala com confiança.” — Yuji Shono, Head of the Global AI Office, NTT Data Group Corporation

Conclusão: por onde começar

A maneira mais fácil de explorar é através do portal Microsoft Foundry. De lá, você pode criar um projeto, fazer deploy de um modelo e construir seu agente. Siga a documentação e os cursos Microsoft Learn. Desenvolvedores podem começar em minutos seguindo o Quickstart, que orienta a configuração, teste e deploy de um hosted agent pronto para produção, ponta a ponta.

Confira o curso AI Agents for Beginners (12 lições) e depois aprofunde-se com laboratórios guiados: Develop AI Agents in Azure, Hosted Agents Workshop (.NET) e o ZavaShop Supply Chain Workshop.

📺 Watch: Foundry Agent Service + Microsoft Agent Framework Explained — Jeff Hollan explica como operacionalizar agentes de IA do deploy ao impacto real.

Se você está participando do Microsoft Build 2026, ou assistindo conteúdo sob demanda depois, não perca estas sessões:

BRK241 — From prototype to production: build and run agents at scale | Session repo
BRK242 — Turn your agents into action: Connect tools, APIs, and documents | session repo
BRK243 — Claw and agent harness in Microsoft Foundry | session repo
DEM333 — How Foundry integrates with open-source frameworks and tools | session repo

Perguntas Frequentes

O que é o Microsoft Agent Framework e quando devo usá-lo?
É um framework open-source da Microsoft, estável em Python e .NET, que unifica Semantic Kernel e AutoGen. Deve ser usado quando você quer uma base opinada e integrada com o ecossistema Foundry, mas sem lock-in: ele é compatível com LangGraph, GitHub Copilot SDK e Claude Agent SDK.
Como funciona a memória procedural e quais ganhos reais ela traz?
Memória procedural permite que o agente aprenda workflows ao longo de execuções, sem necessidade de re-instrução. Resultados iniciais mostram ganhos de +7 a 14% na taxa de sucesso com custo próximo ao baseline. Na prática, um agente de code review aprende a sequência de verificações após uma única orientação.
O que são Toolboxes e como resolvem o problema de integração de ferramentas?
Toolboxes são endpoints gerenciados que expõem múltiplas ferramentas (APIs, documentos, execução de código) com autenticação, ciclo de vida e governança centralizados. Um único URL para qualquer cliente MCP elimina a sobrecarga de integrar cada fonte de dados separadamente — problema comum em agentes que falham antes mesmo de raciocinar.
Como o Agent Optimizer fecha o ciclo de melhoria contínua?
O Agent Optimizer consome traces e avaliações de produção, gera candidatos de melhoria ranqueados (prompts e skills), valida contra cenários e restrições, e recomenda o vencedor com lineage completo, diff e rollback. Ele substitui o ciclo guess-and-check por um loop contínuo de observe → evaluate → optimize → deploy.
O que muda para empresas brasileiras que já usam GitHub Copilot ou LangChain?
A plataforma é framework-agnostic: agentes construídos com Copilot SDK, LangGraph ou Claude Agent SDK podem ser hospedados no Foundry Agent Service sem reescrita. Para quem já investe em GitHub Copilot, o Foundry Toolkit para VS Code permite criar, testar e fazer deploy de agentes diretamente do editor — reduzindo o atrito entre protótipo e produção.

Artigo originalmente publicado em Azure Updates - Latest from Azure Charts.

Tags:

#MicrosoftFoundry #AgentesIA #Build2026 #Azure #DevOps #CloudBrasil #Observability

Gostou? Compartilhe: