A Microsoft anunciou no Build 2026 o Agentic Retrieval, a próxima evolução de sua plataforma de RAG on-prem, habilitada pelo Azure Arc e alimentada pelos modelos de linguagem Foundry. Diferente do RAG tradicional, que apenas recupera e gera, o Agentic Retrieval planeja, raciocina e age – executando recuperação multi-etapas e chamadas de ferramentas (via MCP) inteiramente na infraestrutura local, com rastreabilidade e auditoria obrigatórias.
TL;DR: A Microsoft apresentou no Build 2026 o Agentic Retrieval, plataforma que leva RAG com raciocínio agentico para ambientes on-prem, desconectados e regulados. Com três pilares – motor de orquestração agentico, camada de conhecimento governada e Chat UI pronta para produção – a solução permite que dados nunca saiam da infraestrutura local enquanto entregam respostas rastreáveis e auditáveis. Para empresas brasileiras que lidam com soberania de dados ou operações críticas, isso elimina a dependência de conectividade cloud e viabiliza GenAI confiável em cenários antes inacessíveis.
Para times de engenharia e gestores de TI no Brasil, o movimento da Microsoft consolida uma mensagem clara: a GenAI não precisa (e muitas vezes não deve) depender da nuvem pública. Em setores como financeiro, defesa, indústria regulada e óleo & gás – onde a LGPD, a soberania de dados e a conformidade são requisitos inegociáveis – poder executar modelos e embeddings localmente, com raciocínio agentico, muda o jogo.
O que mudou no Build 2026?
Esta versão entrega três pilares que podem ser usados de forma independente ou combinada:
- Agentic Retrieval engine: runtime de orquestração de primeira parte para planejamento, raciocínio, estado de conversação e chamadas de ferramentas sobre dados locais. Não é mais um “RAG local”: é um orquestrador que decide como decompor perguntas, quais fontes consultar e em que ordem.
- Knowledge: camada dedicada para organizar, curar e governar os dados de grounding, exposta via MCP (Model Context Protocol) e conectável a qualquer camada agentica de recuperação – da Microsoft ou de terceiros.
- Chat UI: interface conversacional pronta para produção, que já vem como padrão no Agentic Retrieval, mas pode ser implantada standalone via Helm chart e container image, com suporte a Entra ID e operação desconectada.
Além disso, a plataforma agora suporta modos flexíveis de deployment (apenas Agentic, apenas Knowledge ou combinado), BYOM com backends plugáveis, catálogo de modelos do Foundry Local, Entra ID, disconnected-ready e busca híbrida combinada com recuperação agentica.
Como o Agentic Retrieval transforma a recuperação de informação?
Classic RAG retrieves, then generates. Agentic Retrieval plans, reasons, and acts. Sob o capô, ele gerencia:
- Planejamento de consulta (query decomposition)
- Recuperação iterativa multi-hop
- Chamadas de ferramentas via MCP
- Estado de conversação
- Grounding obrigatório com citações e audit logging
Image 1: Agentic reasoning trace: query decomposition, retrievals, tool calls, grounded answer
O que isso significa na prática para empresas brasileiras?
- Workflows de compliance, políticas e licenciamento para setor público, órgãos reguladores e defesa – com dados jamais deixando a infraestrutura soberana.
- Síntese multi-documento em normas técnicas, manuais, contratos e procedimentos de campo para operadores industriais.
- Experiência chat agentica para equipes reguladas (engenheiros, inspetores, analistas) que raciocina como um especialista de domínio.
- IA auditável para ambientes soberanos e missão crítica, com cada resposta rastreável até sua fonte.
Por que a camada Knowledge é o diferencial de governança?
Respostas excelentes começam com conhecimento excelente. A Knowledge agora é um componente autônomo: pode ser implantado sozinho ou junto com o Agentic Retrieval, exposto via MCP para conectar a qualquer camada agentica – da Microsoft ou sua.
Entrega:
- Collections: grupos segmentados de conhecimento indexado com permissões granulares de acesso.
- Ingestão multi-fonte: documentos, tabelas, imagens, SharePoint (indexação de source em public preview).
- Parsing de alta fidelidade para conteúdo empresarial complexo.
- Bring Your Own MCP: conectar fontes de dados próprias diretamente no Agentic Retrieval e na experiência de chat.
- Governança aplicada na própria camada de dados.
Image 2: Knowledge management view - collections, sources, and permission scopes
O que isso permite?
- Escopar acesso ao conhecimento por planta, site, classificação ou jurisdição.
- Aplicar soberania de dados, residência e conformidade regulatória na própria camada de conhecimento.
- Fundamentar tanto o Agentic Retrieval da Microsoft quanto orquestrações próprias em uma única fonte de verdade governada.
- Manter dados classificados, proprietários e operacionais totalmente on-prem enquanto entrega experiências de chat premium.
Chat UI: experiência pronta para produção sem reinventar a roda
O Agentic Retrieval agora já vem com uma Chat UI polida e pronta para produção como experiência padrão. O mesmo componente pode ser implantado standalone para equipes que já constroem sua própria stack sobre o Foundry Local.
Destaques:
- Autenticação Entra ID (login MSAL, Bearer tokens, identidade do usuário)
- Backends plugáveis: AI Foundry, BYOM ou mock mode com zero mudanças de código
- Chain-of-Thought visível e citações inline – tornando o grounding transparente para o usuário final
- Frontend standalone com deploy via Helm chart e container image
- Disconnected-ready para ambientes air-gapped
Image 3: Chat UI answer with Chain-of-Thought panel expanded and inline citations
O que isso significa para times de produto e engenharia?
- Acelerar rollout em setores público, defesa, manufatura e missão crítica.
- Construir confiança em workflows regulados através de raciocínio transparente e inspecionável.
- Executar a mesma UI em ambientes air-gapped, nuvens soberanas e sites industriais conectados.
Por que esta release importa para o mercado brasileiro?
Cada atualização da plataforma RAG on-prem da Microsoft reforça uma convicção simples: GenAI deve ser útil onde quer que o cliente opere – regulado ou aberto, conectado ou desconectado, centralizado ou distribuído.
Com Agentic Retrieval, Knowledge e Chat UI integrados, apoiados por Foundry on Arc, BYOM e suporte total a desconexão, isso não é mais “RAG na nuvem, mas local”. É uma plataforma de conhecimento agentica construída para as realidades dos dados corporativos: on-prem, governados e cada vez mais autônomos.
Para empresas brasileiras que já investem em Azure Arc, Foundry Local ou soluções on-prem, essa release fecha o círculo: agora é possível ter o mesmo nível de inteligência conversacional que se espera da nuvem, sem abrir mão do controle, da conformidade e da resiliência operacional.
Perguntas Frequentes
-
O que diferencia o Agentic Retrieval do RAG clássico?
Enquanto o RAG clássico apenas recupera e gera, o Agentic Retrieval planeja, raciocina e age, executando múltiplas etapas de recuperação e chamadas de ferramentas (MCP) em um runtime orquestrado inteiramente na infraestrutura local. Ele gerencia planejamento de consulta, recuperação multi-hop e rastreabilidade obrigatória com citações. -
Preciso usar modelos da Microsoft ou posso trazer meu próprio modelo (BYOM)?
A plataforma suporta BYOM (Bring Your Own Model) com backends conectáveis, integração com o catálogo de modelos do Foundry Local e modos de deployment flexíveis (apenas Agentic, apenas Knowledge ou combinado). Você pode usar modelos de terceiros sem alterações de código. -
Como a camada Knowledge garante a governança dos dados?
A camada Knowledge é um componente independente exposto via MCP, com Collections (grupos segmentados de conhecimento indexado com permissões granulares), ingestão de múltiplas fontes (documentos, tabelas, imagens, SharePoint) e governança aplicada na própria camada de dados – permitindo controle de acesso por planta, site, classificação ou jurisdição. -
Quais cenários no Brasil se beneficiam mais dessa solução?
Empresas dos setores público, defesa, industrial regulado, financeiro e de óleo & gás que precisam de GenAI sem enviar dados para a nuvem. Além de ambientes air-gapped (fábricas, bases remotas), operações com conformidade LGPD rigorosa e workflows que exigem auditoria completa de cada resposta gerada. -
A Chat UI pode ser usada separadamente ou exige o Agentic Retrieval?
A Chat UI é fornecida como experiência padrão do Agentic Retrieval, mas também pode ser implantada de forma independente via Helm chart e container image, com suporte a autenticação Entra ID, backends plugáveis (AI Foundry, BYOM ou mock) e operação desconectada – ideal para quem já tem sua própria stack de orquestração.
Artigo originalmente publicado por moran_assaf em Azure Updates - Latest from Azure Charts.