Facebook finalmente ha confirmado que un error de enrutamiento de BGP causó la interrupción mundial que afectó a sus plataformas y aplicaciones de redes sociales.
Esto se produce después de que competidores como Signal y Telegram compartieran información sobre un éxodo masivo de usuarios de Facebook que se unieron o cambiaron a otras plataformas luego del tiempo de inactividad de 6 horas que afectó a Facebook, Instagram y WhatsApp.
Signal y Telegram también comenzaron a experimentar a raíz de la interrupción global de Facebook después de que millones de usuarios de Facebook se unieran a sus plataformas.
“Últimas inscripciones están muy por arriba de Signal (bienvenidos a todos!),” Equipo de medios de comunicación social de Signal ha twitteado mientras que Facebook estaba tratando con el apagón del lunes.
Esta es una excelente noticia: “Millones de personas nuevas se han unido a Signal hoy y nuestra mensajería y llamadas han estado en funcionamiento, pero algunas personas no ven que todos sus contactos aparezcan en Signal. Estamos trabajando arduamente para solucionar este problema”.
70 millones de refugiados de Facebook se unieron a Telegram en un día – EXCELENTE – 🙂
Pavel Durov, CEO y fundador de Telegram, también agregó que más de 70 millones de usuarios se unieron en un solo día, luego del tiempo de inactividad de Facebook.
También agregó que este diluvio masivo de millones de nuevos usuarios generó problemas de rendimiento, ya que todos intentaban registrarse en la plataforma de mensajería simultáneamente.
“La tasa de crecimiento diaria de Telegram superó la norma en un orden de magnitud, y recibimos a más de 70 millones de refugiados de otras plataformas en un día”, dijo Durov.
“Estoy orgulloso de cómo nuestro equipo manejó el crecimiento sin precedentes porque Telegram continuó funcionando sin problemas para la gran mayoría de nuestros usuarios”.
El director ejecutivo de Facebook, Mark Zuckerberg, trató de minimizar el impacto de este éxodo de usuarios, diciendo que a Facebook no le preocupa la decisión de las personas de cambiarse a la competencia o el dinero perdido debido a tales interrupciones.
“El SEV (evento en el sitio) que interrumpió todos nuestros servicios ayer fue la peor interrupción que hemos tenido en años. Pasamos las últimas 24 horas analizando cómo podemos fortalecer nuestros sistemas contra este tipo de fallas. Esto también fue un recordatorio de lo mucho que nuestro trabajo es importante para la gente “, CEO de Facebook, Mark Zuckerberg, dijo.
“La preocupación más profunda con una interrupción como esta no es cuántas personas se cambian a servicios competitivos o cuánto dinero perdemos, sino qué significa para las personas que dependen de nuestros servicios comunicarse con sus seres queridos, administrar sus negocios o brindar soporte sus comunidades “.
Problema de enrutamiento BGP detrás de la interrupción
El 4 de octubre, aproximadamente a las 11:50 a.m. EST, las tres plataformas de repente se volvieron inalcanzables , y los usuarios informaron que los navegadores web y las aplicaciones mostraban errores de DNS en los intentos de conexión.
Si bien Facebook no proporcionó de inmediato detalles sobre lo que sucedió, más tarde se descubrió que varios prefijos de enrutamiento BGP (Border Gateway Protocol) de Facebook desaparecieron repentinamente, lo que hizo imposible conectarse a cualquiera de los servicios alojados en esas direcciones IP.
“Las rutas BGP que dirigen el tráfico al espacio de direcciones IP de Facebook se han retirado. Internet ya no sabe dónde encontrar las IP de Facebook. Un síntoma es que las solicitudes de DNS están fallando”, dijo Johannes B. Ullrich, Ph.D., Decano de Investigación en el Instituto de Tecnología SANS.
Ayer, la compañía confirmó que un cambio en la configuración del enrutador de la red troncal defectuosa estaba detrás de la interrupción, pero no lo relacionó con un problema de enrutamiento BGP.
Sin embargo, en una actualización publicada más tarde en el día , Facebook reveló que sus servidores DNS deshabilitaron todos los anuncios de BGP después de que se envió un comando para evaluar la disponibilidad de su red troncal global durante un trabajo de mantenimiento de rutina, derribando sus centros de datos en todo el mundo en el proceso.
To the huge community of people and businesses around the world who depend on us: we’re sorry. We’ve been working hard to restore access to our apps and services and are happy to report they are coming back online now. Thank you for bearing with us.
— Facebook (@Facebook) October 4, 2021
“Durante uno de estos trabajos de mantenimiento de rutina, se emitió un comando con la intención de evaluar la disponibilidad de la capacidad de la red troncal global, que sin querer cortó todas las conexiones en nuestra red troncal, desconectando efectivamente los centros de datos de Facebook a nivel mundial”, dijo Santosh Janardhan, vicepresidente. para Ingeniería e Infraestructura en Facebook.
“Nuestros sistemas están diseñados para auditar comandos como estos para evitar errores como este, pero un error en esa herramienta de auditoría no detuvo correctamente el comando”.