Cosa ha causato l'interruzione di AWS di Amazon e perché così tante app importanti sono andate offline?

Daniele Bianchi

Cosa ha causato l’interruzione di AWS di Amazon e perché così tante app importanti sono andate offline?

Lunedì una grave interruzione di Amazon Web Services (AWS) ha interrotto gran parte di Internet, bloccando app, siti Web e strumenti online utilizzati da milioni di persone in tutto il mondo, prima che i servizi venissero finalmente ripristinati.

Dalle app bancarie e dalle compagnie aeree ai dispositivi domestici intelligenti e alle piattaforme di gioco, l’analisi durata ore ha rivelato quanta parte della vita moderna dipenda dall’infrastruttura del cloud.

Storie consigliate

elenco di 1 articolofine dell’elenco

Ecco cosa sappiamo:

Cosa è successo e cosa ha causato l’interruzione di AWS?

Intorno alle 07:11 GMT, il servizio cloud di Amazon ha subito una grave interruzione, il che significa che alcuni dei suoi sistemi hanno smesso di funzionare, interrompendo molte app e siti Web popolari, tra cui banche, piattaforme di gioco e servizi di intrattenimento.

Il problema è iniziato in uno dei principali data center di AWS in Virginia, il suo sito più vecchio e più grande, dopo un aggiornamento tecnico all’API (una connessione tra diversi programmi per computer) di DynamoDB, un servizio chiave di database cloud che memorizza le informazioni degli utenti e altri dati importanti per molte piattaforme online.

Sembra che la causa principale sia stata un errore nell’aggiornamento che ha interessato il Domain Name System (DNS), che aiuta le app a trovare gli indirizzi server corretti. Un DNS funziona come la rubrica di Internet, trasformando i nomi dei siti Web negli indirizzi IP numerici che i computer utilizzano per connettersi ai server.

A causa del problema DNS, le app non sono riuscite a trovare l’indirizzo IP per l’API di DynamoDB e a connettersi.

Quando DynamoDB ha smesso di funzionare, anche altri servizi AWS hanno iniziato a fallire. In totale, 113 servizi sono stati interessati dall’interruzione. Alle 10:11 GMT, Amazon ha affermato che tutte le AWS sono tornate alle normali operazioni, ma c’era un arretrato “di messaggi che finiranno di elaborare nelle prossime ore”.

Al momento della pubblicazione, Downdetector, un sito Web che tiene traccia delle interruzioni di Internet in base alle segnalazioni degli utenti, mostrava ancora problemi con piattaforme come OpenAI, ESPN e Apple Music.

Cos’è un cloud e cos’è esattamente AWS?

Un cloud è un modo per archiviare e utilizzare dati o programmi su Internet anziché sul computer o su altri dispositivi di archiviazione fisici.

Quando le persone dicono che qualcosa è “nel cloud”, significa che i file, le app o i sistemi sono in esecuzione su potenti computer (chiamati server) in data center di proprietà di aziende come Amazon (AWS), Google o Microsoft, non sul tuo dispositivo personale.

In questo caso, AWS consente alle aziende di noleggiare potenza di calcolo e spazio di archiviazione. Fornisce la tecnologia che gestisce siti Web, app e molti servizi online dietro le quinte.

Uno dei servizi principali di AWS è DynamoDB, un database che archivia informazioni importanti per le aziende, come i record dei clienti. Lunedì Amazon ha riferito che i clienti non erano in grado di accedere ai propri dati DynamoDB.

AWS è il più grande fornitore di servizi cloud al mondo.

Le interruzioni del cloud non sono rare, ma sono diventate più evidenti poiché sempre più aziende fanno affidamento su questi servizi ogni giorno.

“Le ricadute hanno avuto un impatto su persone in diversi ambiti”, ha detto ad Oltre La Linea Joshua Mahony, capo analista di mercato di Scope Markets. [But] ovviamente questo tipo di cose arriva con il territorio con le aziende tecnologiche; la chiave è che possono risolverlo rapidamente e non costa loro molti soldi.

Ha detto che Amazon probabilmente supererà la tempesta derivante dall’incidente.

“Stai guardando qualcosa che è relativamente contenuto”, ha detto. “Amazon Web Services ha conquistato da solo il 30% del mercato. I suoi utenti non abbandoneranno la nave all’improvviso. Le loro attività sono profondamente radicate.”

Quali servizi e app non sono più disponibili?

Secondo Downdetector, l’interruzione ha interessato dozzine di siti Web, tra cui Snapchat, Pinterest e Apple TV.

Sono state interessate anche altre app di comunicazione, tra cui: WhatsApp, Signal, Zoom e Slack; servizi di gioco come Roblox, Fortnite e Xbox; e posti come Starbucks. Anche Etsy ha riscontrato problemi.

Anche negli Stati Uniti le persone avevano problemi con le app finanziarie, incluso Venmo.

Alcuni utenti hanno affermato che i loro campanelli Ring e gli altoparlanti Alexa hanno smesso di funzionare, mentre altri non sono riusciti ad accedere al sito Web di Amazon o a scaricare libri sui loro Kindle.

L’app linguistica Duolingo e lo strumento creativo Canva sono stati tra coloro che hanno segnalato errori sui loro siti Web e diverse organizzazioni mediatiche sono state colpite, tra cui l’agenzia di stampa Associated Press, il New York Times e il Wall Street Journal.

Anche le banche, l’exchange di criptovalute Coinbase e la società di intelligenza artificiale Perplexity hanno segnalato problemi, insieme alle compagnie aeree statunitensi Delta e United.

INTERATTIVO: principali servizi Web interessati dall'interruzione di AWS

Perché così tante app importanti sono andate offline contemporaneamente?

Quando AWS ha subito un’interruzione, non sono stati colpiti solo gli strumenti di Amazon. Sono state colpite anche migliaia di altre aziende che utilizzano AWS per l’archiviazione, i database o l’hosting web. Queste aziende includono molte delle principali app che si affidano ad AWS per eseguire parti chiave dei loro sistemi.

“Ogni volta che vediamo questi titoli, il primo pensiero che attraversa la mente di tutti, che manda un brivido lungo la schiena, è: ‘È uno di quegli attacchi informatici? È una cosa guidata dai militari o dall’intelligence che ha portato a questo sconvolgimento?’ E in questo caso non lo è”, ha detto ad Oltre La Linea Bryson Bort, amministratore delegato della società di sicurezza informatica Scythe.

“In effetti, nella maggior parte dei casi non è così. Di solito si tratta di un errore umano.”

Come ha risposto Amazon?

AWS ha riconosciuto l’interruzione e ha affermato che gli ingegneri sono stati “immediatamente impegnati” per risolvere il problema.

AWS ha affermato di aver lavorato su “più percorsi paralleli per accelerare il recupero”. È stato inoltre riferito che il problema principale era stato completamente risolto, sebbene alcuni utenti continuassero a riscontrare lievi ritardi durante il ripristino dei sistemi.

La società ha inoltre affermato che pubblicherà un riepilogo dettagliato post-evento in cui spiegherà cosa è successo.

Una veduta aerea di un data center di Amazon Web Services

Daniele Bianchi

Daniele Bianchi, nativo di Roma, è il creatore del noto sito di informazione Oltre la Linea. Appassionato di giornalismo e di eventi mondiali, nel 2010 Daniele ha dato vita a questo progetto direttamente da una piccola stanza del suo appartamento con lo scopo di creare uno spazio dedicato alla libera espressione di idee e riflessioni. La sua mission era semplice e diretta: cercare di capire e far comprendere agli altri ciò che sta effettivamente succedendo nel mondo. Oltre alla sua attività di giornalista e scrittore, Daniele investe costantemente nell'arricchimento della sua squadra, coinvolgendo professionisti con le stesse passioni e interessi.