No último domingo de manhã, vários sites ao redor do mundo apresentaram instabilidade, tudo graças a um pequeno erro. Após uma configuração incorreta em um de seus data centers, o provedor de serviços de Internet (ISP) CenturyLink dos EUA sofreu uma grande interrupção técnica que se espalhou pela internet, derrubando muitos sites e serviços populares.
O erro no data center da empresa se espalhou para fora de sua rede e também acabou impactando outros ISPs, o que levou a problemas de conectividade para muitas outras empresas, incluindo Amazon, Twitter, NameCheap, OpenDNS, Reddit, Discord, Hulu, Steam e outros.
O Cloudflare também foi severamente afetado pela interrupção do CenturyLink e em um postagem do blog, o CEO e co-fundador da empresa de segurança de sites e infraestrutura da Web Matthew Prince explicou como o incidente afetou a Internet como um todo, dizendo:
“Como essa interrupção pareceu colocar toda a rede CenturyLink / Level (3) offline, os indivíduos que são clientes da CenturyLink não teriam sido capazes de entrar em contato com a Cloudflare ou qualquer outro provedor de Internet até que o problema fosse resolvido. Globalmente, vimos uma queda de 3,5% no tráfego global durante a interrupção, quase tudo devido a uma interrupção quase completa do serviço ISP da CenturyLink nos Estados Unidos. ”
Regra de especificação de fluxo incorreta
Com base nas informações de um página de status do CenturyLink, parece que o problema teve origem no data center CA3 do ISP em Mississauga, localizado na província de Ontário, no Canadá.
Leia também:
Como seus próprios serviços foram afetados pela interrupção, o Cloudflare prestou muita atenção e acredita que uma regra Flowspec incorreta que veio no final de uma longa lista de atualizações BGP pode ter causado isso.
Se fosse esse o caso, todos os roteadores da rede CenturyLink / Level (3) teriam recebido a regra Flowspec e começado a bloquear o BGP, o que os levaria a parar de receber a regra.
Os dispositivos então voltariam a funcionar, percorrendo todas as regras do BGP até chegarem à regra Flowspec incorreta e o BGP mais uma vez ser descartado, criando um loop infinito.
As rotas BGP são um tipo de mensagem que as empresas de Internet transmitem entre si para informar a cada provedor de internet qual grupo de endereços IP está disponível em sua rede. No entanto, a regra Flowspec incorreta da CenturyLink também derrubou alguns roteadores fora de sua rede, que começaram a anunciar rotas BGP incorretas para outros serviços de Internet Tier 1. Isso derrubou outras redes, causando a grande interrupção da Internet ocorrida no fim de semana.
Felizmente, a CenturyLink foi capaz de corrigir o problema dizendo a todos os outros provedores de Internet Tier 1 para ignorar qualquer tráfego vindo de sua rede. Esse tipo de ação geralmente é o último recurso, pois resulta na perda de conexão com a Internet de todos os clientes da empresa.
Com informações: ZDNet