28 de maio de 20265 min de leitura

Nova geração do Amazon OpenSearch Serverless: construa aplicações de IA agentivas com eficiência e economia

Channy Yun (윤석찬)

AWS Blog

Banner - Nova geração do Amazon OpenSearch Serverless: construa aplicações de IA agentivas com eficiência e economia

TL;DR: Este artigo analisa o lançamento da nova geração do Amazon OpenSearch Serverless, um motor de busca e vetores serverless que escala de zero a milhares de requisições por segundo. Para empresas brasileiras que constroem AI agents, a principal conclusão é a redução de custos (até 60% vs. clusters provisionados) e a agilidade na criação de backends de busca sem gerenciar infraestrutura, com integrações diretas com Vercel e Kiro.

A AWS acaba de anunciar a próxima geração do Amazon OpenSearch Serverless, um motor de busca e vetores totalmente gerenciado, desenhado para quem constrói AI agents. O diferencial aqui não é apenas mais uma versão: é a capacidade de escalar de zero a milhares de requisições por segundo e retornar a zero quando ocioso, algo que muda a equação de custo para workloads de IA que muitas vezes são intermitentes. A promessa de economia de até 60% em relação a clusters do OpenSearch Service provisionados para pico merece atenção de times de FinOps no Brasil.

A nova geração cria recursos em segundos e escala a capacidade 20 vezes mais rápido que a anterior. Com criação instantânea de recursos e integrações nativas com plataformas de desenvolvimento de AI como Vercel e Kiro, você pode implantar backends de busca e vetores prontos para produção em minutos, sem se preocupar com infraestrutura.

Como a nova geração do OpenSearch Serverless funciona na prática?

Para começar, acesse o console do Amazon OpenSearch Service e escolha Create collection no menu Serverless.

Dashboard do OpenSearch Serverless

Crie uma coleção NextGen com auto scaling instantâneo e scale-to-zero para otimização de custos. No lançamento, os tipos de coleção suportados são full-text search e vector search. Se você prefere a infraestrutura clássica, escolha Switch to Classic.

A opção Express create é o caminho mais rápido: sem configurações, as políticas de segurança e padrões são aplicados automaticamente. Alguns parâmetros podem ser alterados depois.

Opção Express create

Ao clicar em Create collection, os recursos são provisionados em segundos.

Você também pode criar uma collection via AWS CLI ou SDKs. Exemplo de comando para criar um grupo de coleções:

aws opensearchserverless create-collection-group \
    --name channy-nextgen-group \
    --standby-replicas ENABLED \
    --generation NEXTGEN \
    --description "My NextGen collection group" \
    --capacity-limits '{
        "maxIndexingCapacityInOCU": 10,
        "maxSearchCapacityInOCU": 10,
        "minIndexingCapacityInOCU": 0,
        "minSearchCapacityInOCU": 0
    }' \
    --region "us-east-1"

Depois, crie uma collection que herda a geração do grupo. Tipos suportados: SEARCH e VECTORSEARCH.

aws opensearchserverless create-collection \
    --name channy-nextgen-collection \
    --type SEARCH \
    --collection-group-name channy-nextgen-group \
    --standby-replicas ENABLED \
    --description "My collection in NextGen group" \
    --region "us-east-1"

Para detalhes de gerenciamento, veja a documentação do Amazon OpenSearch Serverless.

Como construir agents mais rápido com OpenSearch Serverless?

A integração com o ecossistema de AI agents é um dos pontos altos. Agora você pode criar uma nova collection OpenSearch ou conectar uma existente diretamente do console da Vercel. Crie um backend de busca em segundos e adicione funcionalidades sob demanda. Saiba mais em AWS for Vercel.

Integração Vercel

Com ferramentas como Claude Code, Cursor e Kiro, você sai de uma ideia para um protótipo funcional em minutos. O repositório OpenSearch Agent Skills oferece skills prontos que trazem inteligência do OpenSearch diretamente para seus agents — cada skill encapsula conhecimento de domínio, melhores práticas e lógica de execução multi-etapas. Além disso, o OpenSearch Launchpad no Kiro Powers acelera a arquitetura de aplicações de busca com planejamento guiado.

Kiro Powers

Disponibilidade e custos

A nova geração está geralmente disponível hoje em todas as regiões comerciais da AWS onde o OpenSearch Serverless já existia. A cobrança é feita por OpenSearch Compute Units (OCUs) para indexação, busca e aceleração por GPU, mais armazenamento em GB-mês. Consulte a página de preços para detalhes.

Teste a nova geração e envie feedback pelo AWS re:Post ou seus contatos de suporte AWS.

Perguntas Frequentes

  • Como a nova geração do OpenSearch Serverless reduz custos?
    Ela escala de zero a milhares de requisições por segundo e volta a zero quando ociosa, eliminando a necessidade de provisionamento para pico. A AWS estima economia de até 60% em comparação com clusters provisionados manualmente, com cobrança por OCU (compute) e armazenamento separado.

  • Em quais regiões AWS a nova geração está disponível?
    Está disponível em todas as regiões comerciais da AWS onde o Amazon OpenSearch Serverless já era oferecido. É recomendável verificar a documentação para regiões específicas, especialmente se você opera no Brasil (us-east-1, sa-east-1 etc.).

  • Preciso modificar minhas aplicações existentes para usar a nova geração?
    Não necessariamente. Você pode criar novas collections com a geração NEXTGEN. Se já usa a versão Classic, pode manter ou migrar criando um novo collection group. As APIs e SDKs são compatíveis, mas o novo modelo de capacity limits (min 0 OCU) exige ajustes nos parâmetros de criação.

  • Quais integrações com plataformas de AI agents estão disponíveis?
    Há integrações nativas com Vercel (criação de collections diretamente no console da Vercel) e com Kiro (via Kiro Powers e OpenSearch Launchpad). Também é possível usar Claude Code, Cursor e repositórios como OpenSearch Agent Skills para incorporar inteligência de busca nos seus agents.

  • Como faço para criar uma collection na nova geração?
    Pelo console da AWS, vá em OpenSearch Service > Serverless > Create collection e escolha NextGen. Também é possível usar AWS CLI ou SDKs, especificando --generation NEXTGEN no create-collection-group e --type SEARCH ou VECTORSEARCH no create-collection.


Artigo originalmente publicado por Channy Yun (윤석찬) em AWS News Blog.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset