web analytics

Uma visão técnica para não-técnicos: afinal, o que se passou com o Facebook, Instagram e WhatsApp?

TLDR (ou seja: Too Long Didn’t Read): Existiu uma falha no BGP do Facebook, e os funcionários não conseguiram entrar no escritório/datacenter.

 

Continuando…

Agora que ficaste mais do que uma frase a ler este artigo, gostava de dar uma visão técnica sobre o que aconteceu ontem (dia 4 de outubro de 2021) na rede de apps do Facebook. Para quem não me conhece sou entusiasta em segurança da informação, diretor de informação do órgão de comunicação social Tugaleaks e trabalho como administrador de sistemas há vários anos.

 

O que aconteceu

Durante a tarde de 4 de outubro o Facebook, Instagram e WhatApp ficaram offline. Timeout. Deixou tudo de responder. Depressa o Twitter foi considerado como o place “to go” para irem buscar informações. E os criadores de memes também estavam lá, obviamente.

Ao longo das horas seguintes foi-se  especulando sobre ataques de hackers  (obviamente…), mas a teoria que ganhava mais força era a de problemas de rede. Algo facilmente confirmável.

Mas para os comuns mortais que não sabem o que isto é,  basicamente tudo o que fosse facebook.com (subdomínios também) deixava de funcionar e isso aconteceu por erros no Border Gateway Protocol (BGP) . O BGP é um mecanismo onde os ISPs (Serviços de Internet, ou Internet Services Providers) partilham informação conjunta e “ligam” a Internet.

 

Porque é que aconteceu

De acordo com um post oficial do Facebook, uma falha na configuração do BGP originou todo este caos. Como as ferramentas de comunicação internas do Facebook trabalhavam, imaginem só, com domínios do Facebook,  acabaram por complicar a resolução das coisas .

O Cloudflare publicou um artigo interessante sobre o que aconteceu, embora seja técnico, recomendo a leitura para poderem ver como funciona a Internet e não apenas “como se abre um site”.

Mas, para além de abrir um site, há uma série de protocolos colocados e um deles falhou. Uma atualização de BGP dia 4 às 15:40 UTC (16:40 em Lisboa) feita erradamente motivou tudo isto, por erro. Resta saber se foi erro humano ou de “máquinas”, mas foi um erro.

Os IPs do Facebook sempre funcionaram, o problema foi mesmo o “endereço” que termina em facebook.com.

 

Conclusão

Portanto como o Facebook deixou de anunciar alguns DNS, incluindo “facebook.com”, nada funcionou.

Foram, por minuto e em estimativa,  afetadas 1,54 triliões de pessoas por minuto. Provavelmente o maior downtime da história até ao momento, e o mais longo .

Infelizmente o mainstream media não tem conhecimento técnico para explicar isto. E como eu tenho, decidi reduzir o “buzz” informático a algumas simples frases que vos pode dar uma ideia técnica, mas ao mesmo tempo não técnica, do que aconteceu.

Espero que este post vos seja útil.

 

Rui

Last modified: 05/10/2021

× Close