Por décadas, a automação de despesas operou sob uma premissa simples: se o sistema consegue ler, ele pode processar. Contudo, qualquer profissional que já tentou submeter um recibo ilegível ou incompleto sabe que o OCR (Optical Character Recognition) tradicional tem um limite claro. Quando faltam dados estruturados — como uma data ou localidade — o processo trava, forçando o retorno ao trabalho manual.
Para eliminar esse gargalo, a equipe de engenharia do SAP Concur decidiu abandonar a dependência exclusiva da simples leitura de texto. O foco mudou para a capacidade de raciocínio. O resultado é a evolução do ExpenseIt, que agora utiliza agentes de IA não apenas para escanear, mas para resolver "quebra-cabeças" lógicos, integrando fotos de recibos e e-mails automaticamente com suporte a decisões contextuais.
A implementação desta arquitetura exigiu mais do que apenas uma API de modelo; foi necessária uma integração profunda com o ecossistema do Google Cloud para garantir escala e performance. Para empresas brasileiras, esse movimento sinaliza uma transição crítica: a infraestrutura cloud não é mais apenas sobre armazenamento e compute, mas sobre habilitar modelos que operam com consciência de negócio.
Velocidade, escala e engenharia de precisão
A grande virada aqui é a capacidade do agente de “preencher lacunas”. Se o seu recibo indica "Main St. Café", mas falta o endereço, a IA agora cruza o dado com o itinerário de viagem e o calendário do usuário para deduzir, por exemplo, qual é o café próximo ao hotel em Greenville, Texas, diferenciando-o de um estabelecimento homônimo em Paris, França.
Para materializar isso, foi utilizada uma arquitetura cognitiva baseada no Gemini, estruturada em cinco pilares:
- Ingestão: Captura via app, scan ou e-mail.
- Núcleo Determinístico: A tecnologia legada da SAP extrai o texto com alta precisão.
- Camada de Roteamento Inteligente: O sistema decide se o dado está claro (segue fluxo normal) ou se é ambíguo (aciona o agente).
- Raciocínio Contextual: A IA utiliza dados de grounding (calendário, reservas).
- Framework ReAct (Reason and Act): O agente valida a hipótese contra os fatos e finaliza o registro.

Padrões de design para agentes de sucesso
O sucesso da implementação do SAP Concur não reside apenas na IA, mas no uso rigoroso de padrões técnicos discutidos em Agentic Design Patterns:
- Routing Pattern: fundamental para o controle de custos. Nem todo recibo precisa de inferência cara; o roteamento direciona apenas o necessário para o agente.
- Reflection Pattern: um loop de gerador-crítico. O modelo testa sua própria hipótese: “Isso é Paris, França? Não, meu itinerário marca Dallas, Texas”. Isso reduz drasticamente as alucinações.
- Tool Use Pattern: acesso direto a APIs de viagem para buscar a fonte da verdade em vez de supor dados.
Arquitetando para a ambiguidade no ecossistema de Cloud
Este projeto demonstra que o real valor da IA corporativa não está na geração desenfreada de conteúdo, mas no uso da IA como um mecanismo de lógica.
Para o tomador de decisão de TI, a mensagem é clara: ao integrar recursos de real-world grounding (como Google Maps ou Google Wallet) com sistemas legados, a experiência do usuário final se torna invisível e eficiente. O futuro da engenharia de sistemas passará pelo edge intelligence, onde modelos como o Gemini Nano permitirão que parte do processamento ocorra diretamente nos dispositivos móveis, garantindo conformidade com LGPD e privacidade de dados, sem abrir mão da velocidade.
Não é preciso reinventar a roda. O Google Agent Development Kit (ADK) hoje oferece os cimentos para quem deseja migrar do simples prompt engineering para a construção de sistemas de agentes robustos e escaláveis.
Artigo originalmente publicado por Jaime SerraGoogle Key Account Executive em Cloud Blog.