2 de junho de 20267 min de leitura

Desbloqueie a Produtividade On-Prem com Agentic Retrieval no Foundry Local

moran_assaf

Azure

Banner - Desbloqueie a Produtividade On-Prem com Agentic Retrieval no Foundry Local

A Microsoft anunciou no Build 2026 o Agentic Retrieval, a próxima evolução de sua plataforma de RAG on-prem, habilitada pelo Azure Arc e alimentada pelos modelos de linguagem Foundry. Diferente do RAG tradicional, que apenas recupera e gera, o Agentic Retrieval planeja, raciocina e age – executando recuperação multi-etapas e chamadas de ferramentas (via MCP) inteiramente na infraestrutura local, com rastreabilidade e auditoria obrigatórias.

TL;DR: A Microsoft apresentou no Build 2026 o Agentic Retrieval, plataforma que leva RAG com raciocínio agentico para ambientes on-prem, desconectados e regulados. Com três pilares – motor de orquestração agentico, camada de conhecimento governada e Chat UI pronta para produção – a solução permite que dados nunca saiam da infraestrutura local enquanto entregam respostas rastreáveis e auditáveis. Para empresas brasileiras que lidam com soberania de dados ou operações críticas, isso elimina a dependência de conectividade cloud e viabiliza GenAI confiável em cenários antes inacessíveis.

Para times de engenharia e gestores de TI no Brasil, o movimento da Microsoft consolida uma mensagem clara: a GenAI não precisa (e muitas vezes não deve) depender da nuvem pública. Em setores como financeiro, defesa, indústria regulada e óleo & gás – onde a LGPD, a soberania de dados e a conformidade são requisitos inegociáveis – poder executar modelos e embeddings localmente, com raciocínio agentico, muda o jogo.

O que mudou no Build 2026?

Esta versão entrega três pilares que podem ser usados de forma independente ou combinada:

  • Agentic Retrieval engine: runtime de orquestração de primeira parte para planejamento, raciocínio, estado de conversação e chamadas de ferramentas sobre dados locais. Não é mais um “RAG local”: é um orquestrador que decide como decompor perguntas, quais fontes consultar e em que ordem.
  • Knowledge: camada dedicada para organizar, curar e governar os dados de grounding, exposta via MCP (Model Context Protocol) e conectável a qualquer camada agentica de recuperação – da Microsoft ou de terceiros.
  • Chat UI: interface conversacional pronta para produção, que já vem como padrão no Agentic Retrieval, mas pode ser implantada standalone via Helm chart e container image, com suporte a Entra ID e operação desconectada.

Além disso, a plataforma agora suporta modos flexíveis de deployment (apenas Agentic, apenas Knowledge ou combinado), BYOM com backends plugáveis, catálogo de modelos do Foundry Local, Entra ID, disconnected-ready e busca híbrida combinada com recuperação agentica.

Como o Agentic Retrieval transforma a recuperação de informação?

Classic RAG retrieves, then generates. Agentic Retrieval plans, reasons, and acts. Sob o capô, ele gerencia:

  • Planejamento de consulta (query decomposition)
  • Recuperação iterativa multi-hop
  • Chamadas de ferramentas via MCP
  • Estado de conversação
  • Grounding obrigatório com citações e audit logging

Agentic reasoning trace
Image 1: Agentic reasoning trace: query decomposition, retrievals, tool calls, grounded answer

O que isso significa na prática para empresas brasileiras?

  • Workflows de compliance, políticas e licenciamento para setor público, órgãos reguladores e defesa – com dados jamais deixando a infraestrutura soberana.
  • Síntese multi-documento em normas técnicas, manuais, contratos e procedimentos de campo para operadores industriais.
  • Experiência chat agentica para equipes reguladas (engenheiros, inspetores, analistas) que raciocina como um especialista de domínio.
  • IA auditável para ambientes soberanos e missão crítica, com cada resposta rastreável até sua fonte.

Por que a camada Knowledge é o diferencial de governança?

Respostas excelentes começam com conhecimento excelente. A Knowledge agora é um componente autônomo: pode ser implantado sozinho ou junto com o Agentic Retrieval, exposto via MCP para conectar a qualquer camada agentica – da Microsoft ou sua.

Entrega:

  • Collections: grupos segmentados de conhecimento indexado com permissões granulares de acesso.
  • Ingestão multi-fonte: documentos, tabelas, imagens, SharePoint (indexação de source em public preview).
  • Parsing de alta fidelidade para conteúdo empresarial complexo.
  • Bring Your Own MCP: conectar fontes de dados próprias diretamente no Agentic Retrieval e na experiência de chat.
  • Governança aplicada na própria camada de dados.

Knowledge management view
Image 2: Knowledge management view - collections, sources, and permission scopes

O que isso permite?

  • Escopar acesso ao conhecimento por planta, site, classificação ou jurisdição.
  • Aplicar soberania de dados, residência e conformidade regulatória na própria camada de conhecimento.
  • Fundamentar tanto o Agentic Retrieval da Microsoft quanto orquestrações próprias em uma única fonte de verdade governada.
  • Manter dados classificados, proprietários e operacionais totalmente on-prem enquanto entrega experiências de chat premium.

Chat UI: experiência pronta para produção sem reinventar a roda

O Agentic Retrieval agora já vem com uma Chat UI polida e pronta para produção como experiência padrão. O mesmo componente pode ser implantado standalone para equipes que já constroem sua própria stack sobre o Foundry Local.

Destaques:

  • Autenticação Entra ID (login MSAL, Bearer tokens, identidade do usuário)
  • Backends plugáveis: AI Foundry, BYOM ou mock mode com zero mudanças de código
  • Chain-of-Thought visível e citações inline – tornando o grounding transparente para o usuário final
  • Frontend standalone com deploy via Helm chart e container image
  • Disconnected-ready para ambientes air-gapped

Chat UI answer
Image 3: Chat UI answer with Chain-of-Thought panel expanded and inline citations

O que isso significa para times de produto e engenharia?

  • Acelerar rollout em setores público, defesa, manufatura e missão crítica.
  • Construir confiança em workflows regulados através de raciocínio transparente e inspecionável.
  • Executar a mesma UI em ambientes air-gapped, nuvens soberanas e sites industriais conectados.

Por que esta release importa para o mercado brasileiro?

Cada atualização da plataforma RAG on-prem da Microsoft reforça uma convicção simples: GenAI deve ser útil onde quer que o cliente opere – regulado ou aberto, conectado ou desconectado, centralizado ou distribuído.

Com Agentic Retrieval, Knowledge e Chat UI integrados, apoiados por Foundry on Arc, BYOM e suporte total a desconexão, isso não é mais “RAG na nuvem, mas local”. É uma plataforma de conhecimento agentica construída para as realidades dos dados corporativos: on-prem, governados e cada vez mais autônomos.

Para empresas brasileiras que já investem em Azure Arc, Foundry Local ou soluções on-prem, essa release fecha o círculo: agora é possível ter o mesmo nível de inteligência conversacional que se espera da nuvem, sem abrir mão do controle, da conformidade e da resiliência operacional.

Perguntas Frequentes

  • O que diferencia o Agentic Retrieval do RAG clássico?
    Enquanto o RAG clássico apenas recupera e gera, o Agentic Retrieval planeja, raciocina e age, executando múltiplas etapas de recuperação e chamadas de ferramentas (MCP) em um runtime orquestrado inteiramente na infraestrutura local. Ele gerencia planejamento de consulta, recuperação multi-hop e rastreabilidade obrigatória com citações.

  • Preciso usar modelos da Microsoft ou posso trazer meu próprio modelo (BYOM)?
    A plataforma suporta BYOM (Bring Your Own Model) com backends conectáveis, integração com o catálogo de modelos do Foundry Local e modos de deployment flexíveis (apenas Agentic, apenas Knowledge ou combinado). Você pode usar modelos de terceiros sem alterações de código.

  • Como a camada Knowledge garante a governança dos dados?
    A camada Knowledge é um componente independente exposto via MCP, com Collections (grupos segmentados de conhecimento indexado com permissões granulares), ingestão de múltiplas fontes (documentos, tabelas, imagens, SharePoint) e governança aplicada na própria camada de dados – permitindo controle de acesso por planta, site, classificação ou jurisdição.

  • Quais cenários no Brasil se beneficiam mais dessa solução?
    Empresas dos setores público, defesa, industrial regulado, financeiro e de óleo & gás que precisam de GenAI sem enviar dados para a nuvem. Além de ambientes air-gapped (fábricas, bases remotas), operações com conformidade LGPD rigorosa e workflows que exigem auditoria completa de cada resposta gerada.

  • A Chat UI pode ser usada separadamente ou exige o Agentic Retrieval?
    A Chat UI é fornecida como experiência padrão do Agentic Retrieval, mas também pode ser implantada de forma independente via Helm chart e container image, com suporte a autenticação Entra ID, backends plugáveis (AI Foundry, BYOM ou mock) e operação desconectada – ideal para quem já tem sua própria stack de orquestração.


Artigo originalmente publicado por moran_assaf em Azure Updates - Latest from Azure Charts.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset