Foundry IQ: Construa Agentes Mais Inteligentes com Conhecimento Unificado e Retrieval Serverless
TL;DR: O Foundry IQ da Microsoft simplifica a construção de agentes de IA ao unificar fontes de conhecimento empresarial (e-mails, documentos, dados estruturados) com retrieval serverless. O destaque é o Serverless (preview), que elimina gestão de clusters e escala a zero. Para empresas brasileiras, isso significa menos custos ociosos e mais agilidade em projetos de IA, mas é crucial avaliar a maturidade dos dados e conformidade com a LGPD antes de adotar.
Desenvolvedores que constroem agentes frequentemente esbarram no mesmo gargalo: a lógica do agente fica pronta rápido, mas a infraestrutura de conhecimento subjacente é complexa de acertar. Levar um agente para produção significa resolver simultaneamente estabilidade, escala, acesso a dados, qualidade das respostas, segurança e ingestão de conteúdo. A Microsoft anunciou o Foundry IQ para simplificar exatamente essa camada, oferecendo uma plataforma de conhecimento empresarial que unifica fontes internas e externas em uma base de conhecimento pronta para agentes.
O que o Foundry IQ muda para equipes de engenharia?
A promessa é clara: reduzir o overhead de configuração de retrieval-augmented generation (RAG) e permitir que agentes consumam conhecimento de múltiplas fontes sem integrações customizadas. Para empresas brasileiras que lidam com alta latência operacional e equipes enxutas, isso pode representar uma aceleração significativa no time-to-market de aplicações de IA.
Foundry IQ Serverless: elasticidade sem reserva de capacidade
O Foundry IQ Serverless (em preview pública) elimina a necessidade de gerenciar clusters. Agentes são workloads tipicamente bursty — executam centenas de passos em segundos e depois ficam ociosos por horas. O modelo serverless escala a zero, cobrando apenas pelo uso (Compute Units a $0.24/hora e armazenamento indexado a partir de $0.29/GB/mês). Para empresas que querem experimentar sem comprometer orçamento, é um convite irrecusável.
| Capacidade | Tier Developer |
|---|---|
| Compute usage | $0.24 CU / hour |
| Indexed storage | Up to $0.29 GB / month; GB cost is region dependent |
| Indexed storage per index | 1 GB / index |
| Indexes per service | 30 indexes / service |
| Services per subscription per region | 5 services / subscription / region |
Ponto de atenção: a cobrança está prevista para começar apenas no final de 2026, e os valores atuais são estimativas. Use esse período para validar a qualidade do retrieval sem custos, mas planeje a migração para tiers pagos se a adoção crescer.
Novas fontes de conhecimento: unificando o caos de dados
Como dar acesso a e-mails, reuniões, dados estruturados e arquivos sem construir conectores customizados? As novas fontes em preview endereçam exatamente isso:
- Work IQ: integra sinais organizacionais (e-mails, Teams, reuniões) respeitando permissões de usuário.
- Fabric IQ: permite que agentes consultem data agents e ontologias (modelos de negócio formais) ligados ao OneLake.
- File Search: upload direto de arquivos para a knowledge base.
- Azure SQL: dados relacionais estruturados.
- MCP Server: conexão com qualquer fonte servida via Model Context Protocol.
A capacidade de combinar dados não estruturados (documentos) com estruturados (SQL, ontologias) em um único retrieval é um diferencial competitivo para empresas que precisam de respostas contextuais precisas.
Web IQ: quando o conhecimento interno não basta
O Microsoft Web IQ agora está disponível como knowledge source, permitindo que agentes busquem na web em tempo real com latência inferior a 165 ms e zero retenção de dados. Isso é relevante para cenários como análise de mercado, suporte a produtos com informações públicas ou compliance regulatória. A Web IQ honra preferências de editores e dados de marketplace, o que reduz riscos legais.
Knowledge bases em GA: produção com SLA e segurança
As knowledge bases do Foundry IQ agora estão em disponibilidade geral, com SLA completo, APIs estáveis, certificações de compliance e suporte a isolamento de rede. O servidor MCP expõe essas bases para qualquer host compatível (Claude, ChatGPT, LangChain, Microsoft Agent Framework). Para empresas brasileiras que exigem garantias contratuais, essa é a porta de entrada para produção.
Qualidade de retrieval: agentic retrieval melhora em até 20%
As atualizações no mecanismo de agentic retrieval trazem ganhos reais de qualidade: recall melhorou até 54% comparado a RAG single-shot, e a qualidade das respostas subiu até 20% nos benchmarks. O segredo está no loop iterativo que faz batch de queries, usa semantic ranker e caching de tokens no servidor. Para times que lutam com alucinações, isso é um alívio técnico.
Segurança: governança na camada de dados
As novas capacidades de segurança em preview incluem chaves gerenciadas pelo cliente (CMK) entre tenants, sincronização incremental de permissões do SharePoint, auditoria de sensitivity labels do Purview e suporte a APIM para integrações. A mensagem é clara: a segurança não deve ser improvisada no código da aplicação, mas sim nativa na plataforma de retrieval. Para empresas brasileiras sujeitas à LGPD, a capacidade de auditar labels e controlar acesso por permissão de origem é essencial.
Data pipeline: ingestão com consciência de layout
A qualidade da ingestão determina o teto da qualidade do retrieval. As novidades em preview incluem indexação de páginas ASPX e Lists do SharePoint, enriquecimento de imagens (para que agentes possam interpretar diagramas e tabelas) e chunking com verbalização de imagem via Azure Content Understanding. Isso significa que agentes não vão mais "ler" apenas texto cru — eles entenderão o contexto visual de gráficos e scans.
Como começar?
O Foundry IQ está disponível no portal Microsoft Foundry. Crie uma knowledge base, conecte suas fontes e use o servidor MCP para integrar com seus frameworks de agente preferidos. A Microsoft também disponibiliza um cookbook e cursos gratuitos.
Se sua empresa depende de infraestrutura cloud e está avaliando agentes de IA, vale a pena experimentar o Foundry IQ Serverless agora — antes da cobrança começar. Mas lembre-se: a qualidade do agente depende diretamente da qualidade dos dados que ele consome. Invista em governança e curadoria de conhecimento primeiro.
Perguntas Frequentes
-
O Foundry IQ Serverless já está disponível para uso em produção?
O Foundry IQ Serverless está em preview pública no tier Developer. A cobrança está prevista para começar no final de 2026, com aviso prévio de 30 dias. Para uso em produção com SLA, a recomendação é utilizar os knowledge bases já em GA. -
Quais fontes de dados o Foundry IQ suporta atualmente?
Em preview, suporta Work IQ (e-mails, reuniões, Teams), Fabric IQ (data agents e ontologias), File Search, Azure SQL e fontes via MCP. Em GA, temos Azure Blob Storage, search indexes, Web e OneLake, com APIs estáveis e certificações de compliance. -
Como fica a segurança dos dados ao usar o Foundry IQ com fontes externas como a Web IQ?
A Web IQ honra as preferências dos editores, não retém dados e tem latência abaixo de 165 ms. Além disso, o Foundry IQ oferece controles de criptografia, sincronização de permissões e governança por sensitivity labels (Purview), garantindo que as políticas da empresa sejam mantidas. -
O Foundry IQ funciona apenas com o ecossistema Microsoft?
Não. O Foundry IQ expõe um servidor MCP (Model Context Protocol) compatível com qualquer host ou cliente MCP, incluindo Claude, ChatGPT, LangChain e o Microsoft Agent Framework. Isso permite integrar agentes de diferentes frameworks sem amarras proprietárias.
Artigo originalmente publicado por Pablo Castro em Azure Updates - Latest from Azure Charts.