TL;DR: A Microsoft Foundry lança memória procedural para agentes, permitindo que eles aprendam com execuções bem-sucedidas e sigam procedimentos de forma consistente. Novos recursos como TTL, gestão visual de memórias e comandos diretos aumentam a transparência e o controle. Para empresas brasileiras, isso significa agentes mais confiáveis em produção, com redução de falhas em tarefas complexas.
Por que a memória de agentes virou prioridade de produção?
Até agora, a memória de agentes era tratada principalmente como um recurso de personalização — lembrar preferências do usuário para manter continuidade em conversas. Mas, ao migrar agentes de demos para ambientes reais, times de engenharia descobriram que a confiabilidade é o verdadeiro gargalo. Não basta saber os fatos; o agente precisa aplicar consistentemente os procedimentos corretos, evitar falhas repetidas e completar tarefas com cada vez mais segurança.
A Microsoft Foundry ataca esse problema com uma série de novidades em seu Foundry Agent Service: memória procedural, uma nova interface de gerenciamento, TTL configurável, suporte multimodal e comandos diretos. Além disso, o Microsoft Agent Framework ganha suporte a file-based memory, facilitando o desenvolvimento local. Para empresas brasileiras que dependem de automação inteligente, essas mudanças representam um salto na maturidade dos agentes.
Como a memória procedural melhora a confiabilidade dos agentes?
A principal inovação é a memória procedural (procedural memory). Em vez de apenas armazenar fatos, ela captura padrões de execução bem-sucedidos — os passos exatos que levaram à conclusão correta de uma tarefa. O processo acontece em duas etapas:
- Ingestão e auditoria de trajetórias: o sistema analisa execuções passadas, identifica padrões eficientes, rotas ineficientes e etapas ausentes. A partir disso, extrai itens de memória procedural estruturados, que descrevem tanto o contexto de uso (pré-condições, sinais) quanto as ações ordenadas (validações, parâmetros de ferramentas, checagens de política).
- Recuperação e injeção no contexto: quando o agente encontra uma tarefa similar, os procedimentos relevantes são recuperados e injetados no contexto de execução, guiando o agente com restrições explícitas no nível de cada passo.
O resultado é que o agente não precisa reinventar o fluxo toda vez. Ele segue um caminho já testado, reduzindo erros como pular validações, usar ferramentas de forma incorreta ou repetir padrões falhos. A Microsoft reporta uma melhoria de cerca de 5% nas métricas pass^5 do STATE-Bench e Tau-Bench — benchmarks que medem a capacidade do agente de cumprir tarefas consistentemente.
Para o engenheiro brasileiro que lida com workflows complexos (como atendimento ao cliente regulado ou automação de processos financeiros), isso significa que o agente pode se tornar confiável o suficiente para ser auditado e colocado em produção com menor risco.
O que muda na gestão de memória no Foundry portal?
Até agora, a memória era uma caixa-preta. Com a nova interface de gerenciamento no portal Microsoft Foundry, desenvolvedores podem inspecionar, entender e ajustar o que o agente está armazenando. É possível visualizar memórias individuais e realizar operações CRUD diretamente na UI.
Essa transparência é crítica para empresas que precisam de governança sobre os dados armazenados pelos agentes — um requisito comum em setores como bancos, seguros e varejo regulado. Poder auditar e corrigir memórias manualmente dá mais controle ao time de operações.
Quais são as novidades em TTL, multimodal e comandos diretos?
Além da memória procedural, três capacidades atendem a pedidos frequentes da comunidade:
- Memória Multimodal: agentes podem agora lembrar informações de imagens — útil em e-commerce (identificar produtos) e suporte ao cliente (analisar prints de erros).
- TTL (Time-to-Live): ao criar um memory store, é possível definir um tempo de vida padrão. Memórias antigas ou de baixo valor são automaticamente removidas, melhorando a qualidade da recuperação e controlando custos de armazenamento.
- Comandos Diretos de Memória: usuários podem explicitamente dizer ao agente para lembrar ou esquecer algo, aumentando o controle e a transparência da experiência.
A configuração é feita via código, como no exemplo abaixo:
options = MemoryStoreDefaultOptions(
chat_summary_enabled=True,
user_profile_enabled=True,
procedural_memory_enabled=True,
default_ttl_seconds=30 * 24 * 60 * 60,
user_profile_details=(
"Avoid irrelevant or sensitive data, such as age, financial details, "
"or anything not useful for personalizing future conversations."
),
)
Como o file-based memory facilita o desenvolvimento local?
O Microsoft Agent Framework agora oferece suporte a memória baseada em arquivos. O objetivo é reduzir o atrito para desenvolvedores que querem começar simples e escalar sem mudar o modelo de desenvolvimento. Com file-based memory, é possível usar arquivos .md (Markdown) para inspecionar, versionar e entender o estado da memória localmente. Depois, o mesmo padrão pode ser levado para produção com uma solução gerenciada.
Exemplo de uso:
from agent_framework import Agent, MemoryContextProvider, MemoryFileStore
store = MemoryFileStore(
base_path=Path("./memory"),
owner_state_key=MEMORY_OWNER_STATE_KEY,
)
memory_provider = MemoryContextProvider(store=store)
agent = Agent(
client=client,
name="MemoryDemoAgent",
instructions="You are a helpful assistant.",
context_providers=[memory_provider],
)
Essa abordagem é especialmente relevante para startups e equipes brasileiras que querem prototipar rapidamente sem se comprometer com uma infraestrutura gerenciada logo de início. A curva de aprendizado é baixa e a inspeção é trivial.
Como começar a usar as novas funcionalidades?
A Microsoft disponibiliza as novidades no portal Foundry (ai.azure.com) e na documentação oficial. Para validar ganhos de confiabilidade, o STATE-Bench (open-source) permite medir se seu agente realmente melhora com a experiência em tarefas empresariais realistas.
Para quem vai ao Microsoft Build 2026, há sessões recomendadas:
- BRK241 — From prototype to production: build and run agents at scale
- BRK242 — Turn your agents into action: Connect tools, APIs, and documents
- BRK243 — Claw and agent harness in Microsoft Foundry
- DEM333 — How Foundry integrates with open-source frameworks and tools
Perguntas Frequentes
-
O que é memória procedural e como ela difere da memória factual?
Memória factual armazena fatos (ex.: preferências do usuário). Memória procedural captura padrões de execução bem-sucedidos — como sequências de ações, validações e uso de ferramentas — para guiar o agente em tarefas similares, aumentando a consistência e reduzindo erros de procedimento. -
Como o TTL (Time-to-Live) impacta custos e qualidade da memória?
O TTL permite configurar automaticamente a expiração de memórias antigas ou de baixo valor. Isso melhora a precisão da recuperação (retrieval quality) e reduz custos de armazenamento, essencial para empresas brasileiras que operam com grandes volumes de dados e buscam eficiência operacional. -
A memória procedural funciona com qualquer tipo de agente ou apenas no Foundry Agent Service?
A memória procedural é um recurso nativo do Foundry Agent Service, integrado ao agent optimizer. Para agentes construídos com o Microsoft Agent Framework, há suporte a file-based memory, que segue o mesmo conceito de aprendizado com execuções, mas em um formato mais simples e inspecionável. -
O file-based memory é indicado para ambientes de produção?
O file-based memory foi projetado para simplificar o desenvolvimento local, usando arquivos .md que são fáceis de versionar e inspecionar. A Microsoft recomenda migrar para uma solução gerenciada (como o Foundry Agent Service) ao levar o agente para produção, garantindo maior escalabilidade e governança. -
Como o STATE-Bench ajuda a validar a melhoria de desempenho dos agentes?
STATE-Bench é um benchmark open-source que mede se agentes realmente melhoram com a experiência em tarefas empresariais realistas. A métrica pass^5 avalia a consistência na conclusão das tarefas. Com memória procedural, a Foundry reportou ganhos de cerca de 5% em STATE-Bench e Tau-Bench, indicando maior confiabilidade.
Artigo originalmente publicado por Lewis Liu em Azure Updates - Latest from Azure Charts.