Cloudflare explica el origen de la falla que dejó fuera de servicio a gran parte de Internet
Un archivo fue el que provocó la caída de ChatGPT, X y muchos otros sitios web importantes
Cloudflare reveló la causa de la interrupción del servicio que provocó la caída de gran parte de Internet: un archivo defectuoso.
El martes, un incidente en la empresa de infraestructura web provocó que muchos de los mayores sitios web del mundo quedaran fuera de servicio. Los visitantes de productos como ChatGPT, X y muchos otros sitios veían en cambio mensajes de error confusos.
Enseguida quedó claro que el problema estaba en Cloudflare, que proporciona infraestructura para garantizar que los sitios web puedan servir sus páginas a los visitantes. Un error técnico hizo que esos sitios web dejaran de funcionar.
Algunos, incluidos los mismos empleados de Cloudflare, habían especulado con que el problema podría ser el resultado de un ciberataque de gran envergadura. Pero la empresa compartió que el problema fue interno, y relativamente sencillo.
Cloudflare tiene un “archivo de características” que mantiene sus sistemas actualizados con posibles amenazas contra las cuales actuar. Pero un cambio en los sistemas de la empresa hizo que su base de datos introdujera múltiples entradas en ese archivo, lo que significó que rápidamente duplicó su tamaño y se envió a todas las máquinas de la red de Cloudflare.
El software que se ejecuta en esas máquinas intentó leer dicho archivo. Pero el tamaño máximo tiene un límite, por lo que el software falló y también lo hicieron multitud de sitios web aparentemente desconectados.
Cloudflare había pensado en un principio que era objeto de un ciberataque, pero finalmente identificó el problema. Entonces pudo actualizarlo y el problema se solucionó por completo unas seis horas después de que comenzara.
Matthew Prince, director ejecutivo de Cloudflare, declaró que la empresa “lamenta el impacto a nuestros clientes y al Internet en general”. “Dada la importancia de Cloudflare en el ecosistema de Internet, cualquier interrupción de cualquiera de nuestros sistemas es inaceptable”, escribió en una publicación explicando los problemas.
“Que haya habido un periodo de tiempo en el que nuestra red no haya podido enrutar el tráfico es profundamente doloroso para todos los miembros de nuestro equipo. Sabemos que hoy les hemos defraudado”.
Traducción de Michelle Padilla



