3 de junho de 20267 min de leitura

Tornando a memória de agentes mais confiável, transparente e pronta para produção

Lewis Liu

Azure

Banner - Tornando a memória de agentes mais confiável, transparente e pronta para produção

TL;DR: A Microsoft Foundry lança memória procedural para agentes, permitindo que eles aprendam com execuções bem-sucedidas e sigam procedimentos de forma consistente. Novos recursos como TTL, gestão visual de memórias e comandos diretos aumentam a transparência e o controle. Para empresas brasileiras, isso significa agentes mais confiáveis em produção, com redução de falhas em tarefas complexas.

Por que a memória de agentes virou prioridade de produção?

Até agora, a memória de agentes era tratada principalmente como um recurso de personalização — lembrar preferências do usuário para manter continuidade em conversas. Mas, ao migrar agentes de demos para ambientes reais, times de engenharia descobriram que a confiabilidade é o verdadeiro gargalo. Não basta saber os fatos; o agente precisa aplicar consistentemente os procedimentos corretos, evitar falhas repetidas e completar tarefas com cada vez mais segurança.

A Microsoft Foundry ataca esse problema com uma série de novidades em seu Foundry Agent Service: memória procedural, uma nova interface de gerenciamento, TTL configurável, suporte multimodal e comandos diretos. Além disso, o Microsoft Agent Framework ganha suporte a file-based memory, facilitando o desenvolvimento local. Para empresas brasileiras que dependem de automação inteligente, essas mudanças representam um salto na maturidade dos agentes.

Como a memória procedural melhora a confiabilidade dos agentes?

A principal inovação é a memória procedural (procedural memory). Em vez de apenas armazenar fatos, ela captura padrões de execução bem-sucedidos — os passos exatos que levaram à conclusão correta de uma tarefa. O processo acontece em duas etapas:

  1. Ingestão e auditoria de trajetórias: o sistema analisa execuções passadas, identifica padrões eficientes, rotas ineficientes e etapas ausentes. A partir disso, extrai itens de memória procedural estruturados, que descrevem tanto o contexto de uso (pré-condições, sinais) quanto as ações ordenadas (validações, parâmetros de ferramentas, checagens de política).
  2. Recuperação e injeção no contexto: quando o agente encontra uma tarefa similar, os procedimentos relevantes são recuperados e injetados no contexto de execução, guiando o agente com restrições explícitas no nível de cada passo.

O resultado é que o agente não precisa reinventar o fluxo toda vez. Ele segue um caminho já testado, reduzindo erros como pular validações, usar ferramentas de forma incorreta ou repetir padrões falhos. A Microsoft reporta uma melhoria de cerca de 5% nas métricas pass^5 do STATE-Bench e Tau-Bench — benchmarks que medem a capacidade do agente de cumprir tarefas consistentemente.

Para o engenheiro brasileiro que lida com workflows complexos (como atendimento ao cliente regulado ou automação de processos financeiros), isso significa que o agente pode se tornar confiável o suficiente para ser auditado e colocado em produção com menor risco.

O que muda na gestão de memória no Foundry portal?

Até agora, a memória era uma caixa-preta. Com a nova interface de gerenciamento no portal Microsoft Foundry, desenvolvedores podem inspecionar, entender e ajustar o que o agente está armazenando. É possível visualizar memórias individuais e realizar operações CRUD diretamente na UI.

Essa transparência é crítica para empresas que precisam de governança sobre os dados armazenados pelos agentes — um requisito comum em setores como bancos, seguros e varejo regulado. Poder auditar e corrigir memórias manualmente dá mais controle ao time de operações.

Quais são as novidades em TTL, multimodal e comandos diretos?

Além da memória procedural, três capacidades atendem a pedidos frequentes da comunidade:

  • Memória Multimodal: agentes podem agora lembrar informações de imagens — útil em e-commerce (identificar produtos) e suporte ao cliente (analisar prints de erros).
  • TTL (Time-to-Live): ao criar um memory store, é possível definir um tempo de vida padrão. Memórias antigas ou de baixo valor são automaticamente removidas, melhorando a qualidade da recuperação e controlando custos de armazenamento.
  • Comandos Diretos de Memória: usuários podem explicitamente dizer ao agente para lembrar ou esquecer algo, aumentando o controle e a transparência da experiência.

A configuração é feita via código, como no exemplo abaixo:

options = MemoryStoreDefaultOptions(
    chat_summary_enabled=True,
    user_profile_enabled=True,
    procedural_memory_enabled=True,
    default_ttl_seconds=30 * 24 * 60 * 60,
    user_profile_details=(
        "Avoid irrelevant or sensitive data, such as age, financial details, "
        "or anything not useful for personalizing future conversations."
    ),
)

Como o file-based memory facilita o desenvolvimento local?

O Microsoft Agent Framework agora oferece suporte a memória baseada em arquivos. O objetivo é reduzir o atrito para desenvolvedores que querem começar simples e escalar sem mudar o modelo de desenvolvimento. Com file-based memory, é possível usar arquivos .md (Markdown) para inspecionar, versionar e entender o estado da memória localmente. Depois, o mesmo padrão pode ser levado para produção com uma solução gerenciada.

Exemplo de uso:

from agent_framework import Agent, MemoryContextProvider, MemoryFileStore

store = MemoryFileStore(
    base_path=Path("./memory"),
    owner_state_key=MEMORY_OWNER_STATE_KEY,
)
memory_provider = MemoryContextProvider(store=store)
agent = Agent(
    client=client,
    name="MemoryDemoAgent",
    instructions="You are a helpful assistant.",
    context_providers=[memory_provider],
)

Essa abordagem é especialmente relevante para startups e equipes brasileiras que querem prototipar rapidamente sem se comprometer com uma infraestrutura gerenciada logo de início. A curva de aprendizado é baixa e a inspeção é trivial.

Como começar a usar as novas funcionalidades?

A Microsoft disponibiliza as novidades no portal Foundry (ai.azure.com) e na documentação oficial. Para validar ganhos de confiabilidade, o STATE-Bench (open-source) permite medir se seu agente realmente melhora com a experiência em tarefas empresariais realistas.

Para quem vai ao Microsoft Build 2026, há sessões recomendadas:

  • BRK241 — From prototype to production: build and run agents at scale
  • BRK242 — Turn your agents into action: Connect tools, APIs, and documents
  • BRK243 — Claw and agent harness in Microsoft Foundry
  • DEM333 — How Foundry integrates with open-source frameworks and tools

Perguntas Frequentes

  • O que é memória procedural e como ela difere da memória factual?
    Memória factual armazena fatos (ex.: preferências do usuário). Memória procedural captura padrões de execução bem-sucedidos — como sequências de ações, validações e uso de ferramentas — para guiar o agente em tarefas similares, aumentando a consistência e reduzindo erros de procedimento.

  • Como o TTL (Time-to-Live) impacta custos e qualidade da memória?
    O TTL permite configurar automaticamente a expiração de memórias antigas ou de baixo valor. Isso melhora a precisão da recuperação (retrieval quality) e reduz custos de armazenamento, essencial para empresas brasileiras que operam com grandes volumes de dados e buscam eficiência operacional.

  • A memória procedural funciona com qualquer tipo de agente ou apenas no Foundry Agent Service?
    A memória procedural é um recurso nativo do Foundry Agent Service, integrado ao agent optimizer. Para agentes construídos com o Microsoft Agent Framework, há suporte a file-based memory, que segue o mesmo conceito de aprendizado com execuções, mas em um formato mais simples e inspecionável.

  • O file-based memory é indicado para ambientes de produção?
    O file-based memory foi projetado para simplificar o desenvolvimento local, usando arquivos .md que são fáceis de versionar e inspecionar. A Microsoft recomenda migrar para uma solução gerenciada (como o Foundry Agent Service) ao levar o agente para produção, garantindo maior escalabilidade e governança.

  • Como o STATE-Bench ajuda a validar a melhoria de desempenho dos agentes?
    STATE-Bench é um benchmark open-source que mede se agentes realmente melhoram com a experiência em tarefas empresariais realistas. A métrica pass^5 avalia a consistência na conclusão das tarefas. Com memória procedural, a Foundry reportou ganhos de cerca de 5% em STATE-Bench e Tau-Bench, indicando maior confiabilidade.


Artigo originalmente publicado por Lewis Liu em Azure Updates - Latest from Azure Charts.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset