Todo comenzó en una computadora del norte de Virginia, alrededor de las 3 de la madrugada, hora local. Pero solo unos minutos después, ya estaba ocurriendo en todo el mundo.

Cuando un centro de datos de Amazon presentó fallas la mañana del lunes, gran parte de internet colapsó. Durante horas, millones de usuarios no pudieron acceder a muchas de las aplicaciones, plataformas y servicios más utilizados a nivel global: desde Snapchat hasta la autoridad tributaria del Reino Unido quedaron fuera de línea.

El incidente dejó en evidencia la complejidad del internet actual: una red profundamente integrada en la vida cotidiana, al mismo tiempo robusta y vulnerable. Para muchos críticos, la magnitud, rapidez y alcance del apagón confirmaron que existe una dependencia excesiva de un pequeño grupo de empresas para mantener en pie la infraestructura digital. Sin embargo, el hecho de que estos eventos sean tan poco frecuentes y se resuelvan con tanta rapidez también explica por qué esas compañías han logrado concentrar tanto poder.

Amazon Web Services (AWS) se presenta como una empresa líder en capacidades y experiencia en la nube. En su sitio web, afirma:

“Amazon Web Services es la nube más completa y adoptada del mundo, lo que permite a los clientes construir cualquier cosa que puedan imaginar. Ofrecemos la mayor variedad de capacidades innovadoras en la nube, sobre la infraestructura global más extensa, con seguridad, confiabilidad y rendimiento líderes en la industria”.

Aunque el lenguaje suena grandilocuente y cargado de jerga técnica, también refleja la escala y complejidad del negocio que maneja Amazon.

En términos simples, AWS proporciona la infraestructura que mantiene en funcionamiento buena parte de internet: computadoras, centros de datos y otras tecnologías que las empresas alquilan para mostrar, por ejemplo, nuestros mensajes en Snapchat o los juegos que descargamos en nuestros dispositivos.

Se trata de un negocio extremadamente exitoso. Como se evidenció tras la reciente caída masiva, muchas compañías dependen de AWS: es la plataforma de servicios en la nube más grande del mundo, con competidores como Microsoft Azure y Google Cloud, y hoy representa la mayor parte de las ganancias de Amazon.

Este crecimiento se debe en gran parte a la facilidad que ofrece a las empresas. Una compañía que desea lanzar una app o un sitio web no necesita construir sus propios centros de datos; puede alquilar la infraestructura necesaria a Amazon y solo paga por lo que usa. Esto también le da a Amazon la posibilidad de operar con mayor eficiencia.

El modelo también es altamente confiable. AWS promete que sus servicios estarán disponibles al menos el 99.99 % del tiempo, y casi siempre cumple con ese estándar.

Pero ese breve momento en que todo falla —y con ello, gran parte de internet— puede tener consecuencias graves. Por eso, interrupciones de este tipo suelen abrir el debate sobre si la infraestructura de internet debería estar más distribuida y descentralizada.

El problema en Amazon Web Services pareció estar relacionado con el sistema de nombres de dominio, o DNS, conocido como la “la guía telefónica de internet”. Cuando una persona escribe en su navegador una dirección web fácil de recordar —como www.the-independent.com, por ejemplo—, el DNS traduce esa dirección en la ubicación real del servidor donde se encuentra alojado el sitio.

La forma en que funciona ese sistema refleja una visión comunitaria —incluso algo utópica— de internet, que marcó sus primeros años de desarrollo. El sistema está distribuido a lo largo de la red y en distintas partes del mundo, lo que permite que internet funcione de manera interconectada.

Sin embargo, ese espíritu de red distribuida se ha ido desvaneciendo con el tiempo. Y eso ayuda a entender por qué interrupciones como la que afectó hoy a AWS son poco comunes, pero resultan extremadamente graves cuando ocurren.

Las tecnologías que sostienen internet han quedado concentradas en un número relativamente pequeño de empresas, lo que permite operar con mayor eficiencia y aprovechar economías de escala, pero también deja a buena parte de la red mundial dependiendo de una base cada vez más reducida.

Incluso empresas lo suficientemente grandes como para operar su propia infraestructura han sufrido las consecuencias de la centralización.

En los últimos años, por ejemplo, Meta unificó la tecnología que respalda sus principales aplicaciones —Facebook, Instagram, WhatsApp, entre otras—, de modo que todas comparten la misma estructura tecnológica en el back-end. Pero esa integración también tiene un costo: cuando se produce una interrupción, por infrecuente que sea, todos sus servicios fallan al mismo tiempo.

El problema de la centralización no se limita solo a la infraestructura web.

El año pasado, una actualización defectuosa enviada por Crowdstrike a computadoras con Windows provocó la caída de miles de sistemas que, en principio, no estaban conectados entre sí: hospitales, aerolíneas y tiendas físicas. Sin embargo, todos utilizaban la misma solución de ciberseguridad y, por eso, colapsaron simultáneamente.

Traducción de Leticia Zampedri