O ecossistema de Containers, Kubernetes e Serverless (CKS) da Oracle Cloud Infrastructure (OCI) está passando por uma evolução que vai além de simples melhorias técnicas. Para empresas brasileiras que buscam escala e estabilidade, as atualizações de janeiro e fevereiro de 2026 desenham um cenário de maior maturidade operacional, especialmente no suporte a cargas de trabalho de Inteligência Artificial e na flexibilidade de rede.
Nesta edição do CKS Roundup, analisamos como essas mudanças impactam o dia a dia dos times de engenharia e as decisões estratégicas de TI.
OKE e Kubernetes AI Conformance: Um Padrão para IA Generativa
O OCI Kubernetes Engine (OKE) consolidou sua posição como uma das primeiras plataformas a receber a certificação Kubernetes AI Conformance do CNCF. Para tomadores de decisão, isso não é apenas um selo: é a garantia de que os blocos fundamentais para treinamento e inferência — como aceleradores (GPUs), agendamento inteligente e percepção de topologia — seguem padrões comunitários abertos.
No contexto brasileiro, onde empresas de varejo e finanças começam a mover modelos de IA para produção, essa conformidade reduz o vendor lock-in e assegura que a infraestrutura de GPU de alta performance da OCI está pronta para o desafio.
OKE e NVIDIA NIM: Inferência de LLM em Escala Empresarial
A integração de microsserviços NVIDIA NIM no OKE resolve um gargalo crítico: como rodar Large Language Models (LLMs) de forma segura dentro da sua própria infraestrutura. Em vez de depender apenas de APIs de terceiros, os gestores podem utilizar containers de inferência otimizados para GPU dentro da sua própria VCN, gerenciando segredos via Vault.
Mixed Node Clusters: Eficiência Operacional e FinOps
A nova funcionalidade de Mixed Node Clusters permite combinar managed nodes, virtual nodes e self-managed nodes em um único cluster de Kubernetes. Na prática, isso permite aplicar conceitos de FinOps com precisão: bancos de dados stateful residem em nós gerenciados estáveis, enquanto front-ends elásticos podem escalar rapidamente em virtual nodes serverless, otimizando custos de computação.
Atualizações Não-Destrutivas: Estabilidade em Primeiro Lugar
Uma das atualizações mais interessantes para times de SRE é a substituição do boot volume para worker nodes. O OKE agora permite atualizar versões de Kubernetes, imagens de OS e chaves SSH sem terminar a instância. Isso mantém o OCID e endereços IP estáveis, reduzindo drasticamente o risco em janelas de manutenção críticas e evitando surpresas de capacidade (stockout) de shapes de GPU.
Reparo de Worker Nodes via API
O suporte para ações de reparo — como reboot e substituição de boot volume — via API do OCI ou do próprio Kubernetes, traz agilidade para a recuperação de desastres. Essas ações respeitam Pod Disruption Budgets (PDBs), garantindo que a saúde do cluster seja restaurada sem comprometer o SLA das aplicações.
Governança e Redes: Load Balancer e VNICs Genéricos
As melhorias nos Load Balancers do OKE trazem IPs previsíveis e manifestos mais limpos. Com anotações para reserved-ips e endereços privados estáveis para NLB, a gestão de regras de firewall e DNS torna-se muito menos caótica.
Para cenários complexos, o Generic VNIC Attachment (GVA) oferece um nível de controle granular antes inexistente: você pode definir quantas VNICs um nó terá e até isolar tráfego de produção e desenvolvimento em interfaces físicas ou virtuais distintas. Isso é vital para conformidade com normas de segurança rigorosas (como a LGPD em setores regulados).
O Fator Humano: Oracle Functions Architect Spotlight
A engenharia de qualidade é feita por pessoas. O destaque para a arquiteta Lavanya Siliveri reforça a importância de padrões de design claros para Oracle Functions. Migrar workloads para modelos serverless exige padrões de migração práticos e guias de escalabilidade que evitem armadilhas operacionais.
Artigo originalmente publicado por Jordan Spore em cloud-infrastructure.