2 de junho de 2026•12 min de leitura

O que há de novo no Microsoft Foundry | Edição Build 2026 — Análise para empresas brasileiras

Nick Brady

Azure

O que há de novo no Microsoft Foundry | Edição Build 2026 — Análise para empresas brasileiras

TL;DR — Este artigo analisa as novidades do Microsoft Foundry anunciadas no Build 2026, com foco em agentes de produção, runtime, ferramentas, memória, grounding, modelos e governança. A conclusão principal é que a plataforma agora oferece componentes prontos para empresas brasileiras colocarem agentes de IA em escala, reduzindo complexidade operacional e riscos, com destaque para o Agent Service, Toolboxes e Foundry IQ.

A Microsoft Foundry apresentou no Build 2026 um conjunto significativo de capacidades que aproximam a plataforma do que times de engenharia no Brasil precisam para levar agentes de IA para produção. Não se trata apenas de novos recursos: a mensagem central é que a Microsoft está consolidando um ecossistema onde runtime, ferramentas, memória, conhecimento, modelos e governança funcionam de forma integrada. Para empresas que dependem de cloud e buscam escalabilidade com estabilidade, vale a pena entender o que muda.

O que testar primeiro

Se você só tem tempo para experimentar uma coisa, comece pela linha que corresponde ao seu desafio atual de construção:

Se você está construindo…	Comece com…	Por que é relevante
Um runtime de agente em produção	Hosted agents no Foundry Agent Service	Sessões sandbox gerenciadas, estado, acesso a filesystem e flexibilidade de framework
Um agente com muitas ferramentas	Toolboxes no Foundry	Um endpoint gerenciado para ferramentas, skills, clientes MCP e dados corporativos
Uma experiência de conhecimento corporativo	Knowledge bases do Foundry IQ	Retrieval com SLA e acesso via MCP sem customização de indexação
Um agente de voz em tempo real	Voice Live	Reconhecimento de fala, TTS, detecção de turno, interrupção e avatares em uma única API
Workflows de avaliação e segurança	ASSERT, ACS e Rubric	Avaliações orientadas por políticas, controles determinísticos em runtime e critérios de pontuação gerados
Experimentação de modelos ou inferência customizada	Fireworks AI no Foundry, modelos MAI e Managed Compute	Mais opções de modelo via endpoints Azure com controles empresariais

Ferramentas de desenvolvimento e SDKs

As atualizações no Microsoft Agent Framework trazem blocos de construção mais estáveis para aplicações de agentes:

Agent harness com skills, memória e middleware — agora em stable release.
Integrações com GitHub Copilot SDK e Claude Agent SDK — stable.
Padrões de orquestração multi-agente, incluindo Magentic-One — stable.
Ferramentas de filesystem, ferramentas de memória e agente de pesquisa profunda — em public preview.

O Foundry Toolkit para VS Code agora está geralmente disponível. Use-o para criar agentes a partir de templates ou com GitHub Copilot, depurar execuções localmente com visualização de traces, conectar a Toolboxes e fazer deploy para o Foundry Agent Service diretamente do VS Code.

Próximo passo: Abra o Foundry Toolkit no VS Code, crie um agente a partir de um template e execute localmente antes de fazer deploy.

Agentes

O Build 2026 adiciona mais peças do quebra-cabeça que os desenvolvedores precisam para levar agentes de protótipos para produção:

Capacidade	Status	Use quando…
Hosted agents	GA esperada até início de julho de 2026	Você precisa de runtime gerenciado, sandbox, estado, filesystem durável e flexibilidade de framework
Routines	Public preview	Quer que um agente execute em timer ou schedule, como triagem noturna de issues ou relatórios diários
Toolboxes	Public preview	Precisa de um endpoint gerenciado para ferramentas, skills, clientes MCP e governança
Voice Live (prompt agents)	GA	Quer o caminho mais rápido para uma experiência de voz em tempo real
Hosted voice agents	Public preview	Quer seu próprio runtime ou framework de orquestração conectado ao Voice Live
Memory	Public preview	Quer que agentes retenham contexto procedural, de usuário ou de sessão
Publicação no Teams e M365 Copilot	GA planejada para junho de 2026	Quer que usuários acessem o agente onde já trabalham

Deploy de agentes em produção com hosted agents e routines

Hosted agents no Foundry Agent Service (GA esperada para julho de 2026) fornecem um runtime gerenciado para agentes de produção. Cada sessão roda em sua própria sandbox com compute, memória e acesso a filesystem dedicados. O runtime é agnóstico a framework: agentes construídos com Microsoft Agent Framework, GitHub Copilot SDK, LangGraph ou outros SDKs podem ser implantados sem reescrita. Dois protocolos são suportados:

Responses API para interações stateful compatíveis com OpenAI.
Invocations protocol para cenários pass-through onde você controla o formato da requisição e resposta.

Routines (public preview) permitem executar qualquer agente em timer ou schedule.

Toolboxes e skills

Toolboxes no Foundry (public preview) dá ao seu agente um único endpoint gerenciado para todos os tipos de ferramenta. Configure as ferramentas uma vez, aponte qualquer cliente MCP para uma URL e deixe o Foundry cuidar de auth, lifecycle e governança. Skills (preview) agora são first-class: versionadas em um catálogo por projeto e descobertas como recursos MCP por qualquer agente do projeto. O Toolbox também se conecta ao Microsoft IQ, incluindo Work IQ, Fabric IQ, Ontology e modelos semânticos, além do Foundry IQ.

Voice Live

Voice Live unifica reconhecimento de fala, TTS, detecção de turno, interrupção, avatares e outros recursos conversacionais em tempo real em uma única API. Para times que constroem com prompt agents, Voice Live já está em GA. Para times que precisam de controle total sobre runtime e orquestração, hosted agents com Voice Live estão em public preview.

Memória

Memória no Foundry Agent Service (public preview) agora inclui três tipos:

Memória procedural (nova no Build) — ajuda o agente a aprender como fazer o trabalho entre execuções. Resultados iniciais mostram ganhos de +7-14% absolutos em taxas de sucesso no Tau-bench.
Memória de usuário — lembra preferências e fatos entre sessões.
Memória de sessão — mantém contexto dentro de um thread de conversa.

Publique agentes onde as pessoas trabalham

Com a publicação para Microsoft Teams e Microsoft 365 Copilot (GA planejada para junho de 2026), qualquer agente do Foundry pode ser implantado diretamente nas ferramentas que os funcionários já usam, com identidade, permissões e políticas fluindo automaticamente.

Conhecimento e grounding

Grounding um agente em conhecimento corporativo normalmente significa construir um pipeline de RAG do zero: chunking, indexação, retrieval e uma integração diferente para cada fonte de dados. O Foundry IQ substitui isso por uma camada dedicada de conhecimento por trás dos seus agentes Foundry. Ele unifica Work IQ, Fabric IQ, Azure SQL, File Search e fontes MCP em um único endpoint de retrieval com SLA. Está disponível hoje e conectado aos Toolboxes.

Atualização do Foundry IQ	Status	Ação para o desenvolvedor
Foundry IQ Serverless	Public preview	Crie um recurso Foundry IQ ou revise a documentação de SKU
Novas fontes de conhecimento	Public preview	Faça grounding de agentes em Work IQ, Fabric IQ, File Search, Azure SQL e MCP com uma knowledge base multi-fonte
Microsoft Web IQ no Foundry IQ	Acesso limitado	Use dados da web ao vivo, de publishers licenciados e de marketplace quando o agente precisar de contexto externo atualizado
Knowledge bases do Foundry IQ	GA	Crie uma knowledge base com SLA e consulte com o quickstart
Melhorias na qualidade do retrieval agentic	Disponível	Compare qualidade das respostas, latência e uso de tokens
Atualizações de segurança	Public preview	Teste criptografia, sincronização de permissões e governança de sensitivity labels
Atualizações do pipeline de dados	Public preview	Use ingestão com layout-aware, image serving e indexação mais ampla do SharePoint

Quando seu agente precisa da web ao vivo, o Web IQ fornece grounding web com menos de 200ms de latência e zero retenção de dados. Está disponível hoje para clientes Azure selecionados.

Modelos e compute

Novos modelos MAI no Microsoft Foundry

Quatro modelos first-party da Microsoft entram em public preview no Build:

MAI-Thinking-1 — LLM de peso médio para chat e raciocínio.
MAI-Image-2.5 — gerador de imagens atualizado com edição imagem-a-imagem.
MAI-Transcribe-2 — modelo de speech-to-text com diarização de falante e content biasing.
MAI-Voice-2 — modelo multilíngue de text-to-speech com clonagem de voz.

Juntos, cobrem as quatro modalidades generativas principais: texto, imagem, transcrição e voz.

Fireworks AI no Foundry

Fireworks AI on Microsoft Foundry agora está em GA, trazendo inferência de modelos open-source através de um único endpoint Azure com SLAs empresariais, onboarding zero-setup, sem infraestrutura separada e sem contratos adicionais. Suporta PTU Data Zone e SOC 2 readiness.

Managed Compute no Foundry Models

Use Managed Compute quando a capacidade regional de GPU for o gargalo e você quiser que o Foundry roteie workloads globalmente sem gerenciar infraestrutura. Suporta fine-tuning e operações simplificadas.

Fine-tuning e Frontier Tuning

Fine-tuning no Foundry entrega resultados de qualidade superior em comparação com prompt engineering, economia de tokens e menor latência em modelos menores. Frontier Tuning é mais de 10x mais eficiente em custo que GPT-5.5 em tarefas como produção de documentação técnica.

Confiança, observabilidade e segurança

O Build também introduziu novas formas de avaliar, controlar e melhorar agentes ao longo do ciclo de desenvolvimento:

Capacidade	Status	Use quando…
ASSERT	Open source	Quer transformar políticas escritas em avaliações executáveis de agentes
Agent Control Specification	Open source	Precisa de controles determinísticos em checkpoints de input, modelo, estado, ferramenta e output
Guided Guardrail Setup	Public preview	Quer guardrails recomendados baseados no público, dados e caso de uso do agente
Rubric evaluator	Public preview	Quer critérios de qualidade gerados e ponderados para um scorecard específico do agente
Tracing e avaliações para qualquer framework	Public preview	Precisa de observabilidade para agentes construídos com LangChain, Semantic Kernel ou frameworks customizados
Agent Optimizer	Em breve em public preview	Quer que traces de produção alimentem sugestões ranqueadas e revisáveis de melhoria
Agent ROI	Private preview	Precisa conectar performance de agente a impacto nos negócios

Quer ajuda para planejar sua estratégia de agentes de IA no Microsoft Foundry? Fale com nossos especialistas.

ASSERT: avaliação open-source orientada por políticas

ASSERT é o novo framework da Microsoft para avaliação de agentes baseada em políticas, construído sobre uma abordagem comprovada da Microsoft Research. Converte políticas em avaliações concretas e mensuráveis, gera cenários de avaliação direcionados e revela defeitos de segurança e qualidade antes da produção. É open source e funciona com LangChain, CrewAI, LightLLM, OpenAI e outros.

Agent Control Specification: um padrão aberto

Agent Control Specification (ACS) é uma especificação industrial aberta para colocar controles determinísticos de segurança e proteção em cinco checkpoints do ciclo de vida do agente: input, LLM, state, tool execution e output. Expresso como um contrato YAML portátil, versionável, auditável e agnóstico a framework. Implementações de referência estão disponíveis para as principais plataformas.

Guided Guardrail Setup no Foundry Agent Builder

Em public preview, um breve questionário sobre público, acesso a dados e caso de uso do agente identifica os riscos relevantes e recomenda os controles adequados (filtros de PII, proteção contra jailbreak, adesão à tarefa) sem exigir conhecimento de segurança.

Rubric evaluator

Rubric é um novo tipo de avaliador no Foundry (public preview) que gera automaticamente critérios de avaliação baseados no contexto específico do agente. Cria critérios customizados a partir da definição do agente, suporta dimensões ponderadas para pontuação agregada e alimenta diretamente o Agent Optimizer.

Tracing, avaliações, otimização e ROI

Tracing e avaliações para qualquer framework (public preview) traz observability de nível de produção para agentes construídos com LangChain, Semantic Kernel ou qualquer framework customizado. Agent Optimizer (em breve) executa a suíte completa de avaliação do Foundry dentro do Foundry AI Operations Service e alimenta resultados no Foundry Optimizer, fechando o loop de sinal de produção para melhorias ranqueadas. ROI para agentes (private preview) mede o impacto real nos negócios: taxas de conclusão de tarefas, tempo economizado e eficiência de custo.

Recursos e comunidade

Documentação do Foundry: comece com a documentação oficial.
Microsoft Build: confira as sessões no catálogo do Build.
Discord: entre no Foundry Discord.
GitHub Discussions: pergunte no fórum.
RSS: assine para receber este resumo mensalmente.
Catálogo de modelos: explore modelos no Foundry.

Perguntas Frequentes

O que são os Hosted Agents e como eles ajudam na produção de agentes?
Hosted Agents são um runtime gerenciado que oferece sandbox, estado persistente, acesso a filesystem e suporte a múltiplos frameworks. Para empresas brasileiras, isso elimina a necessidade de gerenciar infraestrutura de execução de agentes, reduzindo custos operacionais e acelerando o deployment.
Como o Foundry IQ simplifica a implementação de RAG?
Foundry IQ substitui a construção manual de pipelines de RAG ao fornecer uma camada unificada de conhecimento com SLA, suporte a múltiplas fontes (Work IQ, Fabric IQ, Azure SQL, etc.) e acesso via MCP. Isso reduz o esforço de integração e melhora a confiabilidade para aplicações em produção.
Vale a pena considerar os novos modelos MAI e Fireworks AI no Foundry?
Sim, especialmente para empresas que buscam alternativas de inferência com menor latência e custo. Fireworks AI on Foundry oferece modelos open-source com SLA empresarial, enquanto os modelos MAI cobrem texto, imagem, transcrição e voz. Ambos podem ser testados sem compromisso contratual inicial.
Quais ferramentas de segurança e observabilidade foram adicionadas?
Foram introduzidos o ASSERT (avaliação baseada em políticas), Agent Control Specification (controles determinísticos), Guided Guardrail Setup (recomendações de guardrails), Rubric (critérios de qualidade gerados) e tracing para qualquer framework. Isso permite que times brasileiros implementem governança sem depender de especialistas em segurança.
Como a Nuvem Online pode ajudar na adoção do Microsoft Foundry?
A Nuvem Online oferece consultoria em cloud, DevOps e FinOps para ajudar empresas a planejar a migração e operação de agentes de IA no Foundry, desde a escolha de modelos até a otimização de custos e governança.

Artigo originalmente publicado por Nick Brady em Azure Updates - Latest from Azure Charts.

Tags:

#MicrosoftFoundry #Build2026 #AgentesIA #AI #Cloud #Azure #RAG #DevOps

Gostou? Compartilhe:

O que há de novo no Microsoft Foundry | Edição Build 2026 — Análise para empresas brasileiras

Nick Brady

O que há de novo no Microsoft Foundry | Edição Build 2026 — Análise para empresas brasileiras

O que testar primeiro

Ferramentas de desenvolvimento e SDKs

Agentes

Deploy de agentes em produção com hosted agents e routines

Toolboxes e skills

Voice Live

Memória

Publique agentes onde as pessoas trabalham

Conhecimento e grounding

Modelos e compute

Novos modelos MAI no Microsoft Foundry

Fireworks AI no Foundry

Managed Compute no Foundry Models

Fine-tuning e Frontier Tuning

Confiança, observabilidade e segurança

ASSERT: avaliação open-source orientada por políticas

Agent Control Specification: um padrão aberto

Guided Guardrail Setup no Foundry Agent Builder

Rubric evaluator

Tracing, avaliações, otimização e ROI

Recursos e comunidade

Perguntas Frequentes

Você também pode gostar

Simple Log Alerts no Azure Monitor: o que muda para times que monitoram com logs no Brasil?

Simple Log Alerts no Azure Monitor: o que muda para times que monitoram com logs no Brasil?

Observabilidade code-first para agentes da Microsoft Foundry no VS Code: o que muda para desenvolvedores brasileiros

Observabilidade code-first para agentes da Microsoft Foundry no VS Code: o que muda para desenvolvedores brasileiros