La interrupción impidió que personas realizaran tareas cotidianas, como pagar en la peluquería o cambiar sus boletos de avión.

El servicio en la nube de Amazon.com regresó a las operaciones normales el lunes por la tarde, dijo la compañía, después de una interrupción de Internet que causó la agitación mundial entre miles de sitios, incluidas algunas de las aplicaciones más populares de la web como Snapchat y Reddit.

Aún así, algunos servicios de AWS tenían una acumulación de mensajes que tardarían unas horas en procesarse.

AWS aloja aplicaciones y procesos informáticos para empresas de todo el mundo, y la interrupción dejó sin conexión a trabajadores desde Londres hasta Tokio e impidió que otros realizaran tareas cotidianas como pagar a la peluquería o cambiar sus boletos de avión. El lunes por la tarde, los usuarios se quejaron de dificultades persistentes para usar servicios como la billetera digital Venmo y la plataforma de videollamadas Zoom.

Fue la mayor interrupción de Internet desde que el mal funcionamiento de CrowdStrike del año pasado paralizó los sistemas tecnológicos en hospitales, bancos y aeropuertos, destacando la vulnerabilidad de las tecnologías interconectadas del mundo.

Fue al menos la tercera vez en cinco años que el clúster de Virginia del norte de AWS, conocido como US-EAST-1, contribuyó a una importante fusión de Internet.

Amazon no abordó una solicitud para obtener más claridad sobre por qué ese centro de datos en particular sigue siendo afectado. Los problemas se derivaron de lo que se conoce como el Sistema de Nombres de Dominio, o DNS, que impedía que las aplicaciones encontraran la dirección correcta para la API DynamoDB de AWS, una base de datos en la nube en la que se basaba para almacenar información de usuario y otros datos críticos.

La causa raíz es el monitor de salud de la red

Anteriormente, AWS dijo que la causa raíz de la interrupción era un subsistema subyacente que monitorea el estado de sus balanceadores de carga de red utilizados para distribuir el tráfico a través de varios servidores.

El problema, dijo AWS, se originó dentro de la “red interna EC2”, el servicio “Elastic Compute Cloud” de Amazon, que proporciona capacidad en la nube bajo demanda dentro de AWS.

Poco después de las 3 pm (22:00 GMT) Amazon dijo que “todos los servicios de AWS volvieron a las operaciones normales. Algunos servicios como AWS Config, Redshift y Connect continúan teniendo una acumulación de mensajes que terminarán de procesar en las próximas horas”.

Ken Birman, profesor de informática en la Universidad de Cornell, dijo que los desarrolladores de software necesitan construir una mejor tolerancia a los fallos. Dijo que AWS proporciona herramientas que los desarrolladores pueden usar para protegerse en caso de un problema en una de su extensa red de centros de datos, y los desarrolladores también pueden crear copias de seguridad con otros proveedores de la nube.

“Cuando la gente reduce los costos y corta las esquinas para tratar de obtener una aplicación, y luego olvida que se saltaron ese último paso y realmente no protegieron contra un corte, esas compañías son las que realmente deberían ser examinadas más tarde”, dijo Birman a Reuters.

AWS proporciona potencia de computación, almacenamiento de datos y otros servicios digitales a empresas, gobiernos e individuos y es el proveedor de nube más grande del mundo, seguido por Microsoft, Azure y Alphabet’s.

Vía Reuters

Las interrupciones en sus servidores pueden causar interrupciones en sitios web y plataformas, que van desde aplicaciones de entrega de alimentos hasta plataformas de juegos y sistemas de aerolíneas, que dependen de su infraestructura de nube.

AWS dijo en su página de estado que la interrupción del lunes se originó en su ubicación entre Estados Unidos y el EAST-1, su servicio web más antiguo y más grande. El sitio sufrió interrupciones en 2021 y 2020.

Según la documentación en el sitio web de AWS, el sitio US-EAST-1 es a menudo la región predeterminada para muchos servicios de AWS.

“Infraestructuras frágiles”

El problema destaca cuán interconectados se han vuelto los servicios digitales cotidianos y su dependencia de un pequeño número de proveedores de nube global, con un fallo que causa estragos en los negocios y la vida cotidiana, dijeron expertos y académicos.

“Esta interrupción una vez más destaca la dependencia que tenemos de las infraestructuras relativamente frágiles”, dijo Jake Moore, asesor global de ciberseguridad de la firma europea de ciberseguridad ESET.

En Gran Bretaña, Lloyd Bank, Bank of Scotland y proveedores de servicios de telecomunicaciones Vodafone, todos fueron afectados, según el sitio web de Downdetector en el Reino Unido, al igual que el sitio web de impuestos, pagos y autoridad aduanera de Reino Unido HMRC.

“La razón principal de este problema es que todas estas grandes empresas han confiado en un solo servicio”, dijo Nishanth Sastry, director de investigación del Departamento de Ciencias de la Computación de la Universidad de Surrey.

Ookla, propietaria de Downdetector, dijo que más de 4 millones de usuarios reportaron problemas debido al incidente.

“Para las principales empresas, las horas de tiempo de inactividad en la nube se traducen en millones en pérdida de productividad e ingresos”, dijo Ryan Griffin, líder de la práctica cibernética de Estados Unidos en el corredor de seguros McGill and Partners.

Wall Street se mantuvo en gran medida imperturbable y las acciones de Amazon subieron 1.6% a 216.48 dólares.

De Snapchat a Venmo: una interrupción deja caídas las aplicaciones

Ookla dijo que al menos mil empresas se vieron afectadas por el apagón. Apps como Reddit, Roblox, Snapchat y Duolingo. Todos habían sido afectados.

La startup de inteligencia artificial Perplexity, la plataforma de intercambio de criptomonedas Coinbase y la aplicación de trading Robinhood experimentaron interrupciones en sus plataformas y las atribuyeron a AWS. Los propios servicios de Amazon, incluyendo su sitio web de compras, Prime Video y Alexa, también se vieron afectados.

Fortnite, propiedad de Epic Games, Clash Royale y Clash of Clans se encontraba entre las plataformas de juego afectadas. Uber (Nueva York) y El rival Lyft también fue derribado en los Estados Unidos.

En una publicación en X, la presidenta de Signal, Meredith Whittaker, confirmó que la aplicación de mensajería fue golpeada por la interrupción, aunque el multimillonario Elon Musk, propietario de X, dijo que su plataforma continuó funcionando.

Con información de Reuters.

Este artículo fue publicado originalmente en Forbes México

Lea también: Bancolombia, Davivienda y Nequi, entre los afectados por la caída mundial de Amazon Web Services