Para empresas que operam com alta demanda de atendimento ao consumidor, o desafio é equilibrar escalabilidade com a personalização necessária para converter e fidelizar. A estratégia adotada pela Vail Resorts com o lançamento do "My Epic Assistant" é um estudo de caso prático de engenharia de software aplicada à experiência do cliente, onde a IA, longe de ser um simples chatbot, atua como um sistema orquestrado para resolver problemas complexos em tempo real.
Operando destinos de montanha icônicos, a Vail Resorts precisava que sua solução tecnológica — integrada à infraestrutura de cloud — fosse tão fluida quanto a experiência física que oferecem. Em vez de uma busca por informações estáticas, a empresa implementou uma arquitetura baseada nos modelos Gemini, do Google Cloud, desenhada para atuar como um concierge digital. Para gestores de TI e engenheiros, o valor aqui não está apenas na IA generativa, mas na transição de sistemas de consulta rígidos para fluxos conversacionais que mantêm o contexto e a intenção do usuário.
Resultados e Eficiência Operacional

Um novo cenário, resultados mais sólidos
Com a introdução de refinamentos em personalização e fluxos conversacionais, o app atingiu uma redução de 45% na necessidade de transbordo humano (escalation). Para operações brasileiras sujeitas a picos de demanda, o insight é claro: automatizar a lógica de negócio via agentes permite que o time de suporte foque em exceções, enquanto o sistema lida com o volume de consultas qualificadas sem degradação do SLA.
O uso de ferramentas do ecossistema Google Cloud permitiu que os times de engenharia adotassem "design patterns" baseados em agentes, liberando o potencial de conversas naturais sem a necessidade de desenhar manualmente cada intenção (intent design). Isso confere flexibilidade ao sistema, permitindo respostas fluidas, mas estritamente dentro das políticas de negócio e estratégia de produto.
Arquitetura do My Epic Assistant: O fluxo Multi-agente
A construção do My Epic Assistant baseou-se na orquestração de três componentes lógicos (agentes) especializados:
- Subtopic classification agent: Responsável pela triagem inicial. Ele não apenas analisa o texto, mas cruza com objetos de metadados como datas, para rotear o usuário entre passes de temporada ou tickets avulsos.
- Data collection agent: O motor de personalização. Utiliza webhooks para consultar o perfil do usuário (usuários autenticados) ou realiza questionamentos contextuais para novos usuários. O diferencial aqui é a capacidade de manter o contexto da conversa, permitindo que o usuário tire dúvidas paralelas sem perder o progresso do fluxo principal.
- Recommendation agent: A camada final que, de posse dos dados estruturados, consulta uma base de conhecimento (datastore) para sugerir a melhor opção de compra, apresentando "content cards" com links diretos de conversão.

Do ponto de vista de infraestrutura, a utilização de um datastore estruturado para o "pass matrix" e o uso consciente de prompt engineering garantem que as respostas sejam determinísticas onde necessário. Para casos mais sensíveis, o sistema recorre a respostas estáticas via code snippets dentro do próprio playbook, garantindo que a governança sobre o conteúdo seja sempre mantida pela marca.
Esta abordagem de "human-centric design" e otimização por agentes transforma o que seriam gargalos operacionais em um ativo de receita. Não se trata apenas de migrar para a nuvem, mas de orquestrar a inteligência de dados de forma que a tecnologia seja invisível e a jornada do usuário, impecável.
Artigo originalmente publicado por Jacob Walcik, Customer Engineer, Google em Cloud Blog.