
TL;DR: A Atlas, plataforma que opera o sistema de restaurantes, precisava gerenciar centenas de bancos PostgreSQL isolados por cliente. A migração do Cloud SQL Enterprise padrão para a edição Enterprise Plus eliminou a necessidade de gerenciar connection pooling como camada separada, trouxe query insights para identificar gargalos, cache de dados e escalonamento com near-zero downtime. O resultado foi uma redução de 30% no tempo gasto com operações de banco de dados e a possibilidade de crescer 200% a 300% ao ano, liberando o time para focar em inovação e IA.
Como a Atlas constrói o sistema operacional para restaurantes?
A Atlas está criando o que chama de "sistema operacional para restaurantes". São lojas online, ponto de venda (POS), integrações com plataformas de delivery, programas de fidelidade e ferramentas de IA — tudo que um restaurante precisa para começar, operar e crescer. Marcas como SaladStop, Killiney, Haidilao, Raffles Hotel e outras usam a plataforma para aumentar o ticket médio, acelerar vendas e reduzir custos operacionais.
Cada merchant na Atlas recebe seu próprio banco de dados Cloud SQL for PostgreSQL dedicado. A decisão de isolar bancos não é à toa: restaurantes são muito diferentes entre si. Uma cafeteria de única loja e uma rede com dezenas de unidades não devem ter a mesma arquitetura. Com bancos isolados, a Atlas garante separação total de dados, performance previsível mesmo durante os picos de almoço e jantar, e flexibilidade para escalar, ajustar ou migrar cada loja independentemente. À medida que a plataforma cresce, o número de bancos cresce junto.
Por que a edição padrão se tornou um gargalo operacional?
O ponto de partida foi a edição padrão do Cloud SQL Enterprise. Era uma base sólida, mas, conforme novos merchants chegavam e funcionalidades eram lançadas, a camada operacional necessária para gerenciar centenas de bancos virou um gargalo.
O time da Atlas precisava gerenciar o connection pooling como uma camada separada — mais serviços para rodar, proteger e monitorar. Quando uma consulta causava um pico de CPU, eles precisavam saber exatamente o que aconteceu e qual merchant estava por trás, mas passavam muito tempo reconstruindo problemas com sinais limitados. Com uma equipe enxuta e sem engenheiros dedicados a banco de dados, cada componente extra multiplicava a carga de manutenção.
O que mudou com a migração para o Cloud SQL Enterprise Plus?
Ao precisar provisionar novas instâncias, o time do Google Cloud apresentou a edição Enterprise Plus. A preocupação inicial era: quanto mais overhead operacional isso vai adicionar? A surpresa foi que o Enterprise Plus removeu categorias inteiras de trabalho que antes precisavam ser gerenciadas manualmente.
Os quatro pilares que fizeram diferença:
- Managed connection pooling: Agora embutido no Cloud SQL, sem a necessidade de rodar pooling como serviço separado. Menos partes móveis, menos manutenção e superfície de segurança reduzida.
- Query insights: O recurso mais impactante para a Atlas. É possível ver exatamente quais queries são caras e qual merchant as está executando. O tuning de performance deixou de ser um exercício de adivinhação e se tornou algo concreto e acionável. Para uma plataforma que roda centenas de bancos, essa visibilidade é um "superpoder".
- Data cache: Mantém a performance de leitura consistente mesmo com o crescimento dos datasets dos merchants. Como restaurantes geram mais dados a cada dia, a camada de dados precisa continuar rápida.
- Near-zero downtime scaling: Permite escalar instâncias conforme os merchants crescem sem interromper o serviço durante horários de baixa demanda.
Após validar os resultados em uma nova instância, a Atlas migrou todos os bancos existentes para a edição Enterprise Plus.
Qual foi o impacto real no dia a dia da engenharia?
Hoje a Atlas atende milhares de lojas de restaurantes, processa dezenas de milhares de pedidos por dia usando centenas de bancos gerenciados. A mudança mais significativa está na alocação do tempo de engenharia: gastam 30% menos tempo com operações de banco de dados e mais tempo construindo produtos. O onboarding de novos merchants ficou mais simples — um novo restaurante é provisionado em segundos com um banco gerenciado pronto para uso. A equipe consegue ser muito mais proativa em performance, detectando e corrigindo problemas antes que cheguem aos clientes.
O resultado financeiro também apareceu: a Atlas cresceu de 200% a 300% ano após ano.
Como a Atlas está se preparando para o futuro com IA?
A empresa está investindo pesado em IA, tanto internamente quanto externamente. Por dentro, adotaram engenharia agentica — fluxos de desenvolvimento assistidos por IA que permitem a uma equipe enxuta construir, revisar e entregar código significativamente mais rápido. Por fora, estão construindo ferramentas com IA para ajudar operadores de restaurantes a tomar melhores decisões e agir sobre elas.
O roadmap inclui muitas ideias experimentais, incluindo novas superfícies de produto e novas maneiras de ajudar restaurantes a crescer. O que dá confiança para acelerar nessa direção é o fato de que a camada fundamental — Cloud SQL e Google Kubernetes Engine (GKE) — é testada em batalha e não atrapalha.
O que empresas brasileiras podem aprender com esse case?
Para empresas que operam múltiplos tenants com bancos isolados, a lição é clara: a escolha da edição do banco de dados gerenciado pode transformar a operação. Em vez de gastar energia com plumbing de infraestrutura (connection pooling, monitoramento manual, tuning reativo), é possível investir em funcionalidades que geram valor para o negócio.
A observabilidade embutida (Query Insights) é um diferencial competitivo — especialmente para equipes enxutas, comuns no ecossistema brasileiro de startups e scale-ups. A capacidade de escalar sem downtime e manter performance consistente à medida que a base de clientes cresce é um pré-requisito para qualquer plataforma que dependa de banco de dados como core do produto.
Perguntas Frequentes
-
Quais os principais ganhos da migração para o Cloud SQL Enterprise Plus?
A Atlas eliminou a camada separada de connection pooling, ganhou query insights para depuração de performance, data cache para leituras consistentes e escalonamento com near-zero downtime. Isso reduziu em 30% o tempo gasto com operações de banco de dados. -
Como a Atlas garante isolamento entre os dados de cada restaurante?
Cada merchant recebe uma instância Cloud SQL for PostgreSQL dedicada. Isso proporciona separação total de dados, performance previsível mesmo durante picos (horários de almoço e jantar) e flexibilidade para escalar, ajustar ou migrar cada loja independentemente. -
O que é Query Insights e como ele ajudou a Atlas?
Query Insights é um recurso do Enterprise Plus que mostra exatamente quais queries são caras e qual merchant as disparou. Para a Atlas, isso transformou o tuning de performance de um trabalho de adivinhação em uma tarefa concreta, permitindo correções proativas antes que afetem os clientes. -
A migração para o Enterprise Plus exigiu downtime?
Segundo o relato da Atlas, a edição Enterprise Plus oferece near-zero downtime scaling, permitindo escalar instâncias durante o crescimento dos merchants sem interromper o serviço em horários de baixa demanda. A migração completa foi feita após validar os resultados em uma nova instância. -
Qual o plano da Atlas com inteligência artificial?
A Atlas está investindo em engenharia agentica com assistência de IA para acelerar o desenvolvimento interno, e também construindo ferramentas baseadas em IA para ajudar operadores de restaurantes a tomar melhores decisões. A base Cloud SQL + GKE oferece a confiança para mover rápido sem se preocupar com a infraestrutura.
Artigo originalmente publicado por Surendhar Reddy (Co-founder & Head of Engineering, Atlas) e Alok Srivastava (Senior Product Manager, Databases, Google Cloud) em Cloud Blog.