2 de junho de 2026•7 min de leitura

Hosted Agents do Foundry Agent Service: o que muda para empresas brasileiras que levam IA a produção

TL;DR: A Microsoft anunciou no Build 2026 quatro melhorias nos hosted agents do Foundry Agent Service: deploy direto de código (sem container), guardrails integrados de content safety, suporte a voz via WebSocket e um agent optimizer que automatiza a melhoria de prompts e skills. Para empresas brasileiras, o impacto prático é redução da complexidade operacional e ciclos mais rápidos de iteração, sem abrir mão de segurança e escalabilidade.

Os problemas que a Microsoft se propôs a resolver

Desenvolvedores que querem levar agentes de IA para produção enfrentam uma lista de tarefas que nada têm a ver com a inteligência do agente: containerização e infraestrutura, segurança e identidade, persistência de estado, scaling, observabilidade e avaliação contínua. Os hosted agents do Foundry Agent Service foram desenhados para eliminar essa carga operacional. Cada sessão de agente roda em um sandbox isolado por hipervisor, com sistema de arquivos persistente dedicado, identidade Entra ID provisionada automaticamente e tracing nativo via OpenTelemetry. Você traz o código e o framework; a plataforma cuida do resto.

Desde o preview público, quatro novas capacidades foram lançadas.

O que há de novo

1. Deploy diretamente do código fonte — sem container

Antes, para deploy era necessário empacotar a aplicação em uma imagem de container, enviá-la ao Azure Container Registry e configurar o agente. Esse fluxo continua suportado, mas agora há uma alternativa mais rápida: você zipa seu projeto Python ou .NET, envia ao Foundry Agent Service, e a plataforma instala as dependências em tempo de provisionamento (modo remote_build) ou executa diretamente o bundle (modo bundled).

O resultado é um caminho significativamente mais curto do desenvolvimento local ao agente em produção. Para quem usa Azure Developer CLI (azd) ou o Foundry Toolkit para VS Code, o deploy se resume a dois comandos:

azd ai agent init ...
azd deploy

O comando init gera os arquivos de configuração azure.yaml e agent.yaml. O deploy empacota, faz upload com verificação SHA, e aguarda o estado ativo — sem curl manual, sem gerenciamento de tokens e sem container registry.

Runtimes suportados: python_3_13, python_3_14 e dotnet_10. O suporte segue a política de end-of-life de cada linguagem.

2. Guardrails integrados para IA agêntica responsável

Agentes em produção interagem com usuários reais, e usuários reais às vezes enviam conteúdo prejudicial. Antes, cada time precisava integrar manualmente o Content Safety, escrever middleware e gerenciar políticas. Agora, os hosted agents incluem guardrails de content safety nativos, integrados ao runtime. Quando habilitados, todo prompt do usuário é avaliado em tempo real antes de chegar ao código do agente, e toda resposta é filtrada antes de chegar ao usuário final.

Os guardrails estão disponíveis em public preview em todas as regiões onde hosted agents são suportados.

3. Integração com Voice Live e suporte a WebSocket

Agentes que raciocinam e agem são valiosos; agentes que também falam e ouvem em tempo real abrem uma classe diferente de aplicações — atendimento ao cliente, acessibilidade, interfaces de voz. A integração Voice Live com hosted text agent está em preview público, permitindo experiências de voz em tempo real com um clique.

Para agentes nativos speech-to-speech, agora há suporte a WebSocket e WebRTC. Usando o protocolo Invocations (WebSocket) com frameworks como Voice Live, Pipecat ou LiveKit, é possível construir agentes de voz totalmente em tempo real — do microfone à saída de áudio natural, na mesma plataforma segura e escalável.

O endpoint WebSocket expõe uma conexão bidirecional persistente:

wss://{account}.services.ai.azure.com/api/projects/agents/endpoint/protocols/invocations_ws?project_name={project}&agent_name={name}

Disponibilidade: atualmente apenas na região North Central US. Suporte em outras regiões em breve.

A adição do protocolo WebSocket completa a tríade de protocolos para hosted agents, cada um adequado a cenários distintos:

Protocolo	Casos de uso	Características
Responses	Agentes conversacionais, RAG, publicação em Teams/M365	Plataforma gerencia histórico, streaming e ciclo de vida da sessão
Invocations (HTTP)	Webhooks, dados estruturados, streaming customizado	JSON arbitrário entrada/saída; controle do schema e stream SSE
Invocations (WebSocket)	Voz em tempo real, streaming bidirecional	Conexão persistente; integração com Pipecat, LiveKit ou Voice Live

Um mesmo hosted agent pode expor múltiplos protocolos simultaneamente.

4. Agent Optimizer: um motor de melhoria em ciclo fechado

Manter um agente em produção exige ajustes constantes no system prompt, testes manuais e risco de regressão. Para times com dezenas de agentes, isso não escala. O Agent Optimizer automatiza o loop de melhoria: avalia o agente contra critérios definidos, gera novas configurações, ranqueia os resultados e permite deploy da melhor versão — tudo em minutos, sem infraestrutura adicional.

Como funciona:

Avaliação da baseline — o agente processa tarefas com critérios de aprovação/reprovação, gerando uma pontuação composta (0.0 a 1.0).
Geração de candidatos — guiado pelas falhas, o otimizador produz novas configurações para o alvo escolhido.
Avaliação dos candidatos — cada candidato executa o mesmo conjunto de tarefas.
Ranqueamento e recomendação — resultados ordenados por pontuação, com detalhamento por tarefa e custo de tokens.
Deploy do vencedor — um comando promove a configuração vencedora como novo deployment versionado.

Alvos de otimização:

Instruction — reescreve o system prompt para corrigir lacunas observadas.
Skill — gera procedentes nomeados e reutilizáveis.
Model — avalia o agente com múltiplos modelos em uma única execução, ponderando qualidade vs. custo.
Tool Descriptions — refina como o agente entende e invoca ferramentas externas.

Resolvendo o cold-start: o comando azd ai agent eval init gera dataset e critérios de avaliação a partir das instruções existentes do agente, sem necessidade de escrever testes manualmente.

Quer levar seus agentes de IA para produção com menos sobrecarga? Conheça as soluções de cloud da Nuvem Online.

O caminho para a Disponibilidade Geral

Os hosted agents estão em public preview hoje, disponíveis em 20 regiões Azure globalmente. A GA está prevista para o final de junho de 2026. Os focos até lá incluem:

Agent Optimizer em public preview para todas as regiões
ACR privado em BYO virtual network
Managed virtual network
Expansão do Voice Live/WebSocket para mais regiões
Agentes duráveis de longa duração, com recuperação automática após crashes, redeployments e períodos de inatividade

Como começar: siga o QuickStart ou os exemplos de código (Python, C#) que mostram como configurar, testar e fazer deploy de um hosted agent pronto para produção.

Perguntas Frequentes

Preciso usar container para deploy dos hosted agents agora?
Não. A novidade é justamente o deploy direto de código fonte (zip do projeto Python ou .NET), sem necessidade de container. O container ainda é suportado, mas a nova opção reduz atrito em fases iniciais de desenvolvimento.
Os guardrails de content safety estão disponíveis em todas as regiões?
Sim, segundo o anúncio, os guardrails baseados em Content Safety estão disponíveis em public preview em todas as regiões onde hosted agents são suportados (20 regiões globalmente).
Como o Agent Optimizer resolve o cold-start de avaliação?
O comando azd ai agent eval init gera automaticamente um dataset de tarefas e critérios de avaliação a partir das instruções existentes do agente, eliminando a necessidade de escrever testes manualmente desde o início.
O suporte WebSocket para voz está disponível em quais regiões?
Atualmente, o protocolo Invocations (WebSocket) está disponível apenas na região North Central US. A Microsoft planeja expandir para outras regiões em breve.

Artigo originalmente publicado em Azure Updates - Latest from Azure Charts.

Tags:

#FoundryAgentService #MicrosoftBuild #HostedAgents #IA #DevOps #Cloud

Gostou? Compartilhe: