O que há de novo no Microsoft Foundry | Edição Build 2026 — Análise para empresas brasileiras
TL;DR — Este artigo analisa as novidades do Microsoft Foundry anunciadas no Build 2026, com foco em agentes de produção, runtime, ferramentas, memória, grounding, modelos e governança. A conclusão principal é que a plataforma agora oferece componentes prontos para empresas brasileiras colocarem agentes de IA em escala, reduzindo complexidade operacional e riscos, com destaque para o Agent Service, Toolboxes e Foundry IQ.
A Microsoft Foundry apresentou no Build 2026 um conjunto significativo de capacidades que aproximam a plataforma do que times de engenharia no Brasil precisam para levar agentes de IA para produção. Não se trata apenas de novos recursos: a mensagem central é que a Microsoft está consolidando um ecossistema onde runtime, ferramentas, memória, conhecimento, modelos e governança funcionam de forma integrada. Para empresas que dependem de cloud e buscam escalabilidade com estabilidade, vale a pena entender o que muda.
O que testar primeiro
Se você só tem tempo para experimentar uma coisa, comece pela linha que corresponde ao seu desafio atual de construção:
| Se você está construindo… | Comece com… | Por que é relevante |
|---|---|---|
| Um runtime de agente em produção | Hosted agents no Foundry Agent Service | Sessões sandbox gerenciadas, estado, acesso a filesystem e flexibilidade de framework |
| Um agente com muitas ferramentas | Toolboxes no Foundry | Um endpoint gerenciado para ferramentas, skills, clientes MCP e dados corporativos |
| Uma experiência de conhecimento corporativo | Knowledge bases do Foundry IQ | Retrieval com SLA e acesso via MCP sem customização de indexação |
| Um agente de voz em tempo real | Voice Live | Reconhecimento de fala, TTS, detecção de turno, interrupção e avatares em uma única API |
| Workflows de avaliação e segurança | ASSERT, ACS e Rubric | Avaliações orientadas por políticas, controles determinísticos em runtime e critérios de pontuação gerados |
| Experimentação de modelos ou inferência customizada | Fireworks AI no Foundry, modelos MAI e Managed Compute | Mais opções de modelo via endpoints Azure com controles empresariais |
Ferramentas de desenvolvimento e SDKs
As atualizações no Microsoft Agent Framework trazem blocos de construção mais estáveis para aplicações de agentes:
- Agent harness com skills, memória e middleware — agora em stable release.
- Integrações com GitHub Copilot SDK e Claude Agent SDK — stable.
- Padrões de orquestração multi-agente, incluindo Magentic-One — stable.
- Ferramentas de filesystem, ferramentas de memória e agente de pesquisa profunda — em public preview.
O Foundry Toolkit para VS Code agora está geralmente disponível. Use-o para criar agentes a partir de templates ou com GitHub Copilot, depurar execuções localmente com visualização de traces, conectar a Toolboxes e fazer deploy para o Foundry Agent Service diretamente do VS Code.
Próximo passo: Abra o Foundry Toolkit no VS Code, crie um agente a partir de um template e execute localmente antes de fazer deploy.
Agentes
O Build 2026 adiciona mais peças do quebra-cabeça que os desenvolvedores precisam para levar agentes de protótipos para produção:
| Capacidade | Status | Use quando… |
|---|---|---|
| Hosted agents | GA esperada até início de julho de 2026 | Você precisa de runtime gerenciado, sandbox, estado, filesystem durável e flexibilidade de framework |
| Routines | Public preview | Quer que um agente execute em timer ou schedule, como triagem noturna de issues ou relatórios diários |
| Toolboxes | Public preview | Precisa de um endpoint gerenciado para ferramentas, skills, clientes MCP e governança |
| Voice Live (prompt agents) | GA | Quer o caminho mais rápido para uma experiência de voz em tempo real |
| Hosted voice agents | Public preview | Quer seu próprio runtime ou framework de orquestração conectado ao Voice Live |
| Memory | Public preview | Quer que agentes retenham contexto procedural, de usuário ou de sessão |
| Publicação no Teams e M365 Copilot | GA planejada para junho de 2026 | Quer que usuários acessem o agente onde já trabalham |
Deploy de agentes em produção com hosted agents e routines
Hosted agents no Foundry Agent Service (GA esperada para julho de 2026) fornecem um runtime gerenciado para agentes de produção. Cada sessão roda em sua própria sandbox com compute, memória e acesso a filesystem dedicados. O runtime é agnóstico a framework: agentes construídos com Microsoft Agent Framework, GitHub Copilot SDK, LangGraph ou outros SDKs podem ser implantados sem reescrita. Dois protocolos são suportados:
- Responses API para interações stateful compatíveis com OpenAI.
- Invocations protocol para cenários pass-through onde você controla o formato da requisição e resposta.
Routines (public preview) permitem executar qualquer agente em timer ou schedule.
Toolboxes e skills
Toolboxes no Foundry (public preview) dá ao seu agente um único endpoint gerenciado para todos os tipos de ferramenta. Configure as ferramentas uma vez, aponte qualquer cliente MCP para uma URL e deixe o Foundry cuidar de auth, lifecycle e governança. Skills (preview) agora são first-class: versionadas em um catálogo por projeto e descobertas como recursos MCP por qualquer agente do projeto. O Toolbox também se conecta ao Microsoft IQ, incluindo Work IQ, Fabric IQ, Ontology e modelos semânticos, além do Foundry IQ.
Voice Live
Voice Live unifica reconhecimento de fala, TTS, detecção de turno, interrupção, avatares e outros recursos conversacionais em tempo real em uma única API. Para times que constroem com prompt agents, Voice Live já está em GA. Para times que precisam de controle total sobre runtime e orquestração, hosted agents com Voice Live estão em public preview.
Memória
Memória no Foundry Agent Service (public preview) agora inclui três tipos:
- Memória procedural (nova no Build) — ajuda o agente a aprender como fazer o trabalho entre execuções. Resultados iniciais mostram ganhos de +7-14% absolutos em taxas de sucesso no Tau-bench.
- Memória de usuário — lembra preferências e fatos entre sessões.
- Memória de sessão — mantém contexto dentro de um thread de conversa.
Publique agentes onde as pessoas trabalham
Com a publicação para Microsoft Teams e Microsoft 365 Copilot (GA planejada para junho de 2026), qualquer agente do Foundry pode ser implantado diretamente nas ferramentas que os funcionários já usam, com identidade, permissões e políticas fluindo automaticamente.
Conhecimento e grounding
Grounding um agente em conhecimento corporativo normalmente significa construir um pipeline de RAG do zero: chunking, indexação, retrieval e uma integração diferente para cada fonte de dados. O Foundry IQ substitui isso por uma camada dedicada de conhecimento por trás dos seus agentes Foundry. Ele unifica Work IQ, Fabric IQ, Azure SQL, File Search e fontes MCP em um único endpoint de retrieval com SLA. Está disponível hoje e conectado aos Toolboxes.
| Atualização do Foundry IQ | Status | Ação para o desenvolvedor |
|---|---|---|
| Foundry IQ Serverless | Public preview | Crie um recurso Foundry IQ ou revise a documentação de SKU |
| Novas fontes de conhecimento | Public preview | Faça grounding de agentes em Work IQ, Fabric IQ, File Search, Azure SQL e MCP com uma knowledge base multi-fonte |
| Microsoft Web IQ no Foundry IQ | Acesso limitado | Use dados da web ao vivo, de publishers licenciados e de marketplace quando o agente precisar de contexto externo atualizado |
| Knowledge bases do Foundry IQ | GA | Crie uma knowledge base com SLA e consulte com o quickstart |
| Melhorias na qualidade do retrieval agentic | Disponível | Compare qualidade das respostas, latência e uso de tokens |
| Atualizações de segurança | Public preview | Teste criptografia, sincronização de permissões e governança de sensitivity labels |
| Atualizações do pipeline de dados | Public preview | Use ingestão com layout-aware, image serving e indexação mais ampla do SharePoint |
Quando seu agente precisa da web ao vivo, o Web IQ fornece grounding web com menos de 200ms de latência e zero retenção de dados. Está disponível hoje para clientes Azure selecionados.
Modelos e compute
Novos modelos MAI no Microsoft Foundry
Quatro modelos first-party da Microsoft entram em public preview no Build:
- MAI-Thinking-1 — LLM de peso médio para chat e raciocínio.
- MAI-Image-2.5 — gerador de imagens atualizado com edição imagem-a-imagem.
- MAI-Transcribe-2 — modelo de speech-to-text com diarização de falante e content biasing.
- MAI-Voice-2 — modelo multilíngue de text-to-speech com clonagem de voz.
Juntos, cobrem as quatro modalidades generativas principais: texto, imagem, transcrição e voz.
Fireworks AI no Foundry
Fireworks AI on Microsoft Foundry agora está em GA, trazendo inferência de modelos open-source através de um único endpoint Azure com SLAs empresariais, onboarding zero-setup, sem infraestrutura separada e sem contratos adicionais. Suporta PTU Data Zone e SOC 2 readiness.
Managed Compute no Foundry Models
Use Managed Compute quando a capacidade regional de GPU for o gargalo e você quiser que o Foundry roteie workloads globalmente sem gerenciar infraestrutura. Suporta fine-tuning e operações simplificadas.
Fine-tuning e Frontier Tuning
Fine-tuning no Foundry entrega resultados de qualidade superior em comparação com prompt engineering, economia de tokens e menor latência em modelos menores. Frontier Tuning é mais de 10x mais eficiente em custo que GPT-5.5 em tarefas como produção de documentação técnica.
Confiança, observabilidade e segurança
O Build também introduziu novas formas de avaliar, controlar e melhorar agentes ao longo do ciclo de desenvolvimento:
| Capacidade | Status | Use quando… |
|---|---|---|
| ASSERT | Open source | Quer transformar políticas escritas em avaliações executáveis de agentes |
| Agent Control Specification | Open source | Precisa de controles determinísticos em checkpoints de input, modelo, estado, ferramenta e output |
| Guided Guardrail Setup | Public preview | Quer guardrails recomendados baseados no público, dados e caso de uso do agente |
| Rubric evaluator | Public preview | Quer critérios de qualidade gerados e ponderados para um scorecard específico do agente |
| Tracing e avaliações para qualquer framework | Public preview | Precisa de observabilidade para agentes construídos com LangChain, Semantic Kernel ou frameworks customizados |
| Agent Optimizer | Em breve em public preview | Quer que traces de produção alimentem sugestões ranqueadas e revisáveis de melhoria |
| Agent ROI | Private preview | Precisa conectar performance de agente a impacto nos negócios |
ASSERT: avaliação open-source orientada por políticas
ASSERT é o novo framework da Microsoft para avaliação de agentes baseada em políticas, construído sobre uma abordagem comprovada da Microsoft Research. Converte políticas em avaliações concretas e mensuráveis, gera cenários de avaliação direcionados e revela defeitos de segurança e qualidade antes da produção. É open source e funciona com LangChain, CrewAI, LightLLM, OpenAI e outros.
Agent Control Specification: um padrão aberto
Agent Control Specification (ACS) é uma especificação industrial aberta para colocar controles determinísticos de segurança e proteção em cinco checkpoints do ciclo de vida do agente: input, LLM, state, tool execution e output. Expresso como um contrato YAML portátil, versionável, auditável e agnóstico a framework. Implementações de referência estão disponíveis para as principais plataformas.
Guided Guardrail Setup no Foundry Agent Builder
Em public preview, um breve questionário sobre público, acesso a dados e caso de uso do agente identifica os riscos relevantes e recomenda os controles adequados (filtros de PII, proteção contra jailbreak, adesão à tarefa) sem exigir conhecimento de segurança.
Rubric evaluator
Rubric é um novo tipo de avaliador no Foundry (public preview) que gera automaticamente critérios de avaliação baseados no contexto específico do agente. Cria critérios customizados a partir da definição do agente, suporta dimensões ponderadas para pontuação agregada e alimenta diretamente o Agent Optimizer.
Tracing, avaliações, otimização e ROI
Tracing e avaliações para qualquer framework (public preview) traz observability de nível de produção para agentes construídos com LangChain, Semantic Kernel ou qualquer framework customizado. Agent Optimizer (em breve) executa a suíte completa de avaliação do Foundry dentro do Foundry AI Operations Service e alimenta resultados no Foundry Optimizer, fechando o loop de sinal de produção para melhorias ranqueadas. ROI para agentes (private preview) mede o impacto real nos negócios: taxas de conclusão de tarefas, tempo economizado e eficiência de custo.
Recursos e comunidade
- Documentação do Foundry: comece com a documentação oficial.
- Microsoft Build: confira as sessões no catálogo do Build.
- Discord: entre no Foundry Discord.
- GitHub Discussions: pergunte no fórum.
- RSS: assine para receber este resumo mensalmente.
- Catálogo de modelos: explore modelos no Foundry.
Perguntas Frequentes
-
O que são os Hosted Agents e como eles ajudam na produção de agentes?
Hosted Agents são um runtime gerenciado que oferece sandbox, estado persistente, acesso a filesystem e suporte a múltiplos frameworks. Para empresas brasileiras, isso elimina a necessidade de gerenciar infraestrutura de execução de agentes, reduzindo custos operacionais e acelerando o deployment. -
Como o Foundry IQ simplifica a implementação de RAG?
Foundry IQ substitui a construção manual de pipelines de RAG ao fornecer uma camada unificada de conhecimento com SLA, suporte a múltiplas fontes (Work IQ, Fabric IQ, Azure SQL, etc.) e acesso via MCP. Isso reduz o esforço de integração e melhora a confiabilidade para aplicações em produção. -
Vale a pena considerar os novos modelos MAI e Fireworks AI no Foundry?
Sim, especialmente para empresas que buscam alternativas de inferência com menor latência e custo. Fireworks AI on Foundry oferece modelos open-source com SLA empresarial, enquanto os modelos MAI cobrem texto, imagem, transcrição e voz. Ambos podem ser testados sem compromisso contratual inicial. -
Quais ferramentas de segurança e observabilidade foram adicionadas?
Foram introduzidos o ASSERT (avaliação baseada em políticas), Agent Control Specification (controles determinísticos), Guided Guardrail Setup (recomendações de guardrails), Rubric (critérios de qualidade gerados) e tracing para qualquer framework. Isso permite que times brasileiros implementem governança sem depender de especialistas em segurança. -
Como a Nuvem Online pode ajudar na adoção do Microsoft Foundry?
A Nuvem Online oferece consultoria em cloud, DevOps e FinOps para ajudar empresas a planejar a migração e operação de agentes de IA no Foundry, desde a escolha de modelos até a otimização de custos e governança.
Artigo originalmente publicado por Nick Brady em Azure Updates - Latest from Azure Charts.