21 de maio de 20263 min de leitura

A resiliência não é suficiente: as novas regras da continuidade de negócios

Jon Lin

Equinix

Banner - A resiliência não é suficiente: as novas regras da continuidade de negócios

A resiliência não é suficiente: as novas regras da continuidade de negócios

Este artigo analisa por que a resiliência focada apenas em failover e redundância tornou-se insuficiente diante da complexidade sistêmica das operações modernas. Incidentes em cloud regions, cabos submarinos e dependências de software criam um 'blast radius' que organizações não estão preparadas para absorver. A estratégia de continuidade de negócios exige agora uma transição de modelos reativos para uma arquitetura designada para lidar com o impacto, reconhecendo que interrupções severas não são mais eventos raros, mas uma constante no ambiente operacional.

A continuidade de negócios entrou em uma nova era. Por décadas, a resiliência foi construída em torno de redundância, failover e mecanismos de recuperação. No entanto, esse modelo pressupunha que as interrupções seriam eventos isolados e plenamente recuperáveis. O cenário de infraestrutura atual é distinto: cloud regions ficam offline, cabos submarinos são rompidos e grids de energia falham sob condições climáticas extremas. Além disso, as dependências de software operam em cascades, cruzando sistemas interconectados. Quando uma falha ocorre, o blast radius é, quase sempre, muito maior do que o que fora projetado ou arquitetado.

Esses cenários deixaram de ser eventos categoria "black swan". Eles estão se tornando parte intrínseca do nosso ambiente operacional. Atualmente, empresas globais absorvem, em média, US$ 400 bilhões em prejuízos por tempo de inatividade anualmente, com um custo médio de US$ 540 mil por hora.

Cada vez mais, a capacidade de absorver o impacto torna-se um diferencial competitivo, exigindo que gestores de TI e engenheiros de SRE não foquem apenas em evitar o erro, mas em como o sistema se comporta sob falha total para assegurar a perenância do negócio.


Artigo originalmente publicado por Jon Lin em Interconnections – The Equinix Blog.

Perguntas Frequentes

  • Por que a estratégia de redundância tradicional não é mais suficiente?
    Modelos tradicionais baseiam-se na premissa de falhas isoladas. Hoje, interdependências de software e falhas sistêmicas em larga escala geram um 'blast radius' que a redundância simples não consegue mitigar.

  • O que caracteriza os novos riscos de infraestrutura mencionados?
    Os riscos atuais incluem quedas de cloud regions, rompimento de cabos submarinos e instabilidade em grids de energia, que transcendem o planejamento clássico de desastres e ocorrem com frequência crescente.

  • Qual o real impacto financeiro das interrupções para empresas Globais?
    O impacto estimado chega a US$ 400 bilhões anuais, com um custo médio de cerca de US$ 540 mil por hora de downtime, tornando a resiliência um imperativo financeiro e não apenas técnico.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset