Quando Amazon Web Services (AWS) è andato offline il 20 ottobre, i titoli dei giornali si sono concentrati sull'impatto sui social media e sulle interruzioni dello streaming. Ma l'effetto a catena è stato di più ampia portata. L'interruzione ha dimostrato quanto la nostra vita sia diventata connessa all'infrastruttura cloud. Ha persino trasformato i letti intelligenti di alcuni utenti in inutili "sacchi bagnati".
Amazon ha poi confermato l'origine del problema. Il guasto è stato rintracciato nella regione US-East-1, nella Virginia settentrionale. È qui che il suo servizio di database distribuito, DynamoDB, si è guastato e ha innescato una reazione a catena. Il guasto ha impedito nuove connessioni online. Questo ha messo in crisi le macchine virtuali EC2, i bilanciatori di carico di rete e le API di backend dipendenti. In parole povere, una delle arterie di dati più critiche di Internet si è intasata e il mondo ne ha risentito.
Letti intelligenti spenti dal cloud
Tra le vittime inaspettate c'è stato Pod di Eight Sleep da 7.000 dollari. Il Pod è un materasso intelligente che utilizza la circolazione dell'acqua e la mappatura della temperatura AI per ottimizzare il sonno. Il fermo del server AWS ha colpito anche l'azienda di tecnologia del sonno.
La dipendenza del sistema Pod dall'apprendimento automatico basato sul cloud e dalla sincronizzazione biometrica in tempo reale lo ha reso vulnerabile. Poiché i suoi algoritmi e i dati degli utenti vengono eseguiti sui server AWS, l'interruzione ha reso il sistema temporaneamente inutilizzabile. Infatti, un utente ha riferito che un lato del letto si è surriscaldato a 110°F.
Eight Sleep lancia una soluzione per la "modalità di interruzione"
In risposta, il CEO di Eight Sleep Matteo Franceschetti ha confermato il problema su X e ha promesso una soluzione. Entro 24 ore, l'azienda ha lanciato un ripiego Bluetooth a bassa energia che ha chiamato "modalità di interruzione". Si tratta di un livello di controllo locale che bypassa le API del cloud e consente la comunicazione diretta tra dispositivi e app. Consente agli utenti di regolare i loro letti via Bluetooth quando Internet non funziona.
Nel frattempo, gli ingegneri di AWS hanno lavorato per ore per ripristinare il servizio. Una volta raggiunto questo obiettivo, hanno riavviato i sistemi principali fino a quando la connettività non è stata ristabilita. Amazon ha rilasciato delle scuse formali, definendo l'interruzione del servizio "un evento significativo". Ha promesso di implementare delle garanzie architettoniche per evitare che si ripeta. Ma questa non sarà la prima volta che accade.
Un punto debole ricorrente nel cloud di Amazon
La regione USA-Est-1 è da tempo il tallone d'Achille di AWS. Ironia della sorte, è l'hub più antico e più trafficato dell'azienda di cloud. Ciononostante, è stata l'epicentro delle interruzioni nel 2021, 2023 e 2024, interrompendo servizi importanti come Disney+, Slack e Zoom.
Ogni volta, i guasti a cascata all'interno delle dipendenze interne di AWS hanno amplificato quelli che erano iniziati come problemi isolati del sistema. Da allora gli ingegneri hanno avvertito che l'ipercentralizzazione dei carichi di lavoro in regioni specifiche comporta un rischio sistemico. Questo potrebbe essere mitigato da una distribuzione del carico più intelligente e dalla ridondanza regionale.
Dipendenza dal cloud: un problema sistemico
Anche se la storia può sembrare divertente, richiama l'attenzione su un problema crescente: la fragilità dell'hardware dipendente dal cloud. AWS, Google Cloud e Microsoft Azure ospitano collettivamente i sistemi di backend su cui si basa la maggior parte dei dispositivi connessi. Sono utilizzati con vari dispositivi, dai termostati ai monitor medici. Quando si guastano, si guastano anche i dispositivi che le persone ritengono indipendenti.
I sostenitori dei consumatori affermano che dovrebbe essere introdotto uno standard di 'diritto al funzionamento', che richieda che le funzioni principali continuino a funzionare anche quando i servizi cloud si guastano. I sistemi di fallback locali, come i controlli AI o Bluetooth sul dispositivo, possono preservare l'usabilità e ridurre la dipendenza da centri dati distanti.
L'incidente di Eight Sleep dovrebbe essere un campanello d'allarme: la rivoluzione "intelligente" è affidabile solo quanto i server che la sostengono. Finché i produttori di hardware non daranno priorità al controllo locale, anche una cosa semplice come andare a letto potrebbe dipendere da un centro dati che rimane sveglio.
Fonte(i)
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones




