TL;DR: O crescimento rápido de agentes de IA em empresas gera desafios de custo, segurança e conformidade. Este artigo apresenta uma arquitetura de referência para o Azure que separa o plano de controle da execução, utilizando três camadas: Azure AI Gateway (tráfego e quotas), Azure AI Foundry (governança de comportamento e inventário) e Microsoft Agent 365 (identidade e conformidade). A conclusão é que, para escalar IA, é necessário tratar agentes como workloads governáveis, não apenas como experimentos.
É comum ver empresas iniciarem com um ou dois agentes de IA — um chatbot aqui, um resumidor de documentos ali. Contudo, em pouco tempo, times de desenvolvimento começam a implementar múltiplos sistemas autônomos que consomem APIs e dados internos sem coordenação. Para gestores de TI e arquitetos, o desafio deixa de ser a qualidade do modelo e passa a ser: quem é o dono desse agente? Quais dados ele acessa? Por que o custo de tokens explodiu?
A construção de um agente é rápida, mas a governança operacional é o que separa um experimento isolado de uma implementação enterprise robusta. O risco aqui não é apenas técnico, é de governança e finanças.
O princípio arquitetural: separando controle da execução
A regra de ouro para evitar o caos em ambientes de nuvem é clara: o plano de controle deve ser segregado do plano de runtime. O Azure já aplica isso através de Management Groups e Azure Policy, e esta arquitetura estende esse modelo para agentes de IA.
O plano de runtime é onde a inferência ocorre (frequentemente em múltiplas regiões), enquanto o plano de controle reside em uma camada superior, tratando de identidade, segurança e políticas independentes da localização geográfica.
Camada 1: Azure AI Gateway — governando cada request
O primeiro nível de controle atua diretamente no caminho da requisição. O Azure AI Gateway (via API Management) centraliza todo o tráfego, garantindo:
- Controle de Quotas e Rate Limits: O uso da policy
llm-token-limitprevine que um agente consuma todo o orçamento de tokens da empresa. - Content Safety: Integração automática para moderar prompts, impedindo que requisições inseguras cheguem aos modelos.
- Resiliência: Em deployments multi-region, o tráfego é roteado automaticamente caso uma região sofra indisponibilidade.
Camada 2: Azure AI Foundry Control Plane — governando comportamento em escala
O segundo nível vai além do tráfego: ele monitora o que o agente faz. Com o Azure AI Foundry, temos visibilidade total de inventário e avaliação contínua.
- Avaliações em produção: É possível medir a precisão das chamadas de ferramentas e riscos de exposição de dados sensíveis.
- Centralização de Guardrails: Permite aplicar políticas e remediação em massa em toda a frota de agentes.
- Segurança: Integração nativa com Microsoft Entra (para identidade do agente), Defender (para ameaças) e Purview (para compliance de dados).
Camada 3: Microsoft Agent 365 — oversight corporativo
Por fim, a terceira camada reconhece que agentes não operam em um vácuo. Eles atuam em fluxos de trabalho do dia a dia da organização. O Microsoft Agent 365 traz os agentes para o modelo administrativo que os gestores de TI já utilizam para usuários corporativos, incluindo o rastreamento em um registry centralizado e a possibilidade de quarentena de agentes não autorizados.
Como garantir que a arquitetura funcione
A chave para o sucesso é a automação via infraestrutura. O acionamento de um projeto de IA deve ser via pipeline, que já realiza o deployment dos projetos de Foundry, APIM e logs de forma padronizada. Assim, a governança já nasce atrelada ao ciclo de vida do desenvolvimento.
Esta arquitetura não promete eliminar a necessidade de processos de aprovação humana, mas garante que, quando o "sim" for dado pelo negócio, a infraestrutura já esteja pronta, monitorada e em conformidade.
Agent sprawl é um erro de arquitetura, não de ferramenta. Ao separar planos, você ganha a agilidade necessária para inovar sem perder a visibilidade necessária para proteger a empresa.
Perguntas Frequentes
-
O que esta arquitetura resolve em termos operacionais para as empresas?
Ela resolve o problema do 'descontrole de agentes' (agent sprawl), separando o plano de execução do plano de controle, permitindo gerenciar inventário, custos e segurança de forma centralizada e escalável. -
Qual é a função do Azure AI Gateway na estrutura proposta?
O Azure AI Gateway atua na borda como uma camada de observabilidade e imposição de políticas operacionais, como quotas de tokens e filtros de segurança, evitando que aplicações drenem o orçamento ou violem políticas de conteúdo. -
Por que o Microsoft Agent 365 é necessário se já temos o Azure AI Foundry?
O Azure AI Foundry foca na governança técnica e comportamental, enquanto o Microsoft Agent 365 provê a integração necessária com o ecossistema de produtividade (Microsoft 365), identidade Entra ID e sistemas de conformidade corporativa.
Artigo originalmente publicado em Azure Updates - Latest from Azure Charts.