Notebookcheck Logo

CheckMag | La sconfitta di Intel contro AMD a Supercomputing 2023 è stata più grande di mezzo milione di Ryzen 9 - letteralmente

Aurora ha finalmente fatto il suo debutto quest'estate, con circa mezzo decennio - due generazioni di grafica Nvidia, o sei versioni di Call of Duty - di ritardo rispetto alla tabella di marcia. (Immagine: Argonne National Laboratory)
Aurora ha finalmente fatto il suo debutto quest'estate, con circa mezzo decennio - due generazioni di grafica Nvidia, o sei versioni di Call of Duty - di ritardo rispetto alla tabella di marcia. (Immagine: Argonne National Laboratory)
Le cornici da gioco possono essere oggetto di grande entusiasmo su Internet, ma quando il mondo aziendale ha ordini di grandezza di denaro in più da buttare, il mondo delle interconnessioni e degli acceleratori è molto più importante.
Opinione da Matthew Lee
Pensieri e opinioni espressi nel testo appartengono esclusivamente all'autore

Alla conferenza Supercomputing 2023 di novembre, la lista aggiornata Top500 dei supercomputer più potenti al mondo ha rivelato che il sistema Aurora di Intel - originariamente previsto per il 2018 - non è riuscito a superare la macchina Frontier di AMD che il sistema Aurora di Intel - originariamente previsto per il 2018 - non è riuscito a superare la macchina Frontier di AMD. Aurora, installato presso l'Argonne National Laboratory, ha ottenuto un punteggio di 585,34 PetaFLOPS nel benchmark LINPACK ad alte prestazioni (HPL), mentre Frontier, residente presso l'Oak Ridge National Laboratory del Tennessee, ha mantenuto il suo vantaggio con un punteggio HPL di 1.194 PFLOPS. Entrambi questi numeri superano assolutamente il risultato di <1 TeraFLOP ottenuto da Ryzen 9 7950X nei test HPL di Puget Systems (anche se quest'ultimo è molto più conveniente da acquistare su Amazon!).

Ora, naturalmente, ci sono molti asterischi da aggiungere. Aurora è stata installata solo alla fine di giugno e da allora è stata sottoposta a test di messa a punto e di stabilità; il risultato un po' sottotono presentato alla Top500 è stato ottenuto con solo metà della macchina operativa. Gran parte del periodo di ritardo era dovuto a slittamenti da parte dei partner piuttosto che di Intel stessa. I ritardi non erano solo spostamenti statici di tempistiche per lo stesso hardware, e nel prodotto finale sono state implementate generazioni più avanzate di chip Intel rispetto a quanto originariamente previsto. L'elenco continua.

Ma il punto è che si tratta di un elenco che probabilmente non interessa a molte persone che stanno guardando tutto questo.

Frontier è in cima alla classifica da quando ha superato Fugaku - e ha superato la barriera di 1-ExaFLOP - nel maggio 2022. (Immagine: Top500)
Frontier è in cima alla classifica da quando ha superato Fugaku - e ha superato la barriera di 1-ExaFLOP - nel maggio 2022. (Immagine: Top500)

L'esecuzione è fondamentale per i clienti commerciali. Se un accordo sul livello di servizio richiede un tempo di attività di cinque nove, quel 99,999% non ha spazio per molti asterischi. Da questo punto di vista, Intel - al livello più alto, con un contratto stipulato da un cliente governativo (il Dipartimento dell'Energia degli Stati Uniti, nientemeno) - si è piazzata al secondo posto, battuta da un sistema consegnato un anno e mezzo prima e così ritardato che avrebbe dovuto essere in servizio prima ancora che il rivale fosse annunciatohttps://www.notebookcheck.net/AMD-and-Cray-are-building-world-s-fastest-exascale-supercomputer.420246.0.html .

Un risultato del genere può avere implicazioni significative per il mercato business, anche se questi sistemi sembrano una torre d'avorio separata dai rack del mondo reale. Proprio come le prestazioni nella fascia alta della grafica consumer hanno garantito a Nvidia una quota mentale inattaccabile tra gli appassionati di hardware, Frontier di AMD, che siede al vertice e difende la sua posizione da diciotto mesi a questa parte, potrebbe vedere gli effetti alone scendere lungo lo stack di prodotti fino ai suoi processori EPYC e agli acceleratori Radeon Instinct. Potrebbe accadere anche l'inverso, con le CPU Xeon e gli acceleratori Xe di Intel che potrebbero essere macchiati da questa sconfitta (e gli acceleratori Xe ) di Intel vengano macchiati da questa sconfitta (e dai più ampi problemi di Aurora), a prescindere dai loro meriti.

Poi c'è la questione del consumo energetico. Sebbene Aurora stia fornendo solo circa un quarto dei due ExaFLOP (cioè circa 2.000 PetaFLOP) precedentemente dichiarati come obiettivo da Intel come obiettivo da parte di Intel, sta assorbendo quasi la metà della potenza. Questo lo colloca a 24,7 MW, che in realtà è quasi 2 MW in più rispetto a Frontier, e una volta aggiustato per quest'ultimo che sta pompando 1,194 ExaFLOP, la situazione dell'efficienza per il team blu è particolarmente disastrosa.

Ci possono essere diverse spiegazioni per questo, ma nessuna di esse fa apparire Intel in buona salute. Forse le tanto decantate CPU server Sapphire Rapids e le GPU Ponte Vecchio sono terribilmente inefficienti già in partenza; forse il consumo energetico dichiarato comprendeva l'infrastruttura e il raffreddamento dell'intero supercomputer e non solo la metà che è stata presentata alla lista Top500, oppure anche l'altra metà del sistema è attiva e mostra un consumo energetico inattivo piuttosto sconcertante. In ogni caso, i numeri principali indicano che la soluzione di Intel offre meno della metà dell'efficienza della concorrenza - e anche se i supercomputer giganti in sé non sono applicabili ai potenziali clienti aziendali, la bolletta dell'elettricità lo è sicuramente.

Sebbene i processori Xeon Phi "Knight's Hill" originariamente previsti per Aurora non si siano mai concretizzati, negli anni successivi Intel ha continuato ad aumentare l'obiettivo di prestazioni per il sistema. (Immagine: Intel)
Sebbene i processori Xeon Phi "Knight's Hill" originariamente previsti per Aurora non si siano mai concretizzati, negli anni successivi Intel ha continuato ad aumentare l'obiettivo di prestazioni per il sistema. (Immagine: Intel)

C'è solo un'altra domanda, però: chi dice che non sono applicabili al mondo aziendale?

Certo, le medaglie d'oro e d'argento sono state costruite su (e per) piattaforme di calcolo ad alte prestazioni su misura, ma anche il sistema Eagle di Microsoft di Microsoft è salito sul podio. I 561,2 PetaFLOP di Eagle per l'elaborazione dei numeri sono stati costruiti a partire da unità HGX H100 di Nvidia, più standardizzate, e saranno disponibili per l'uso di modelli AI e macchine virtuali attraverso la Azure Cloud Platform; un sistema commerciale realizzato con hardware commerciale, che si colloca al di sopra di tutti i sistemi HPC su misura del mondo, tranne due.

Alla fine della giornata, il mondo dell'informatica di consumo è nanizzato dalla scala pura e semplice dei mercati dei server e dei data center. I duelli per le prestazioni e l'efficienza al loro apice avranno effetti a catena, molto più impattanti per i profitti di un produttore di chip rispetto a qualsiasi lista di "Migliori CPU da gioco".

Please share our article, every link counts!
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2023 12 > La sconfitta di Intel contro AMD a Supercomputing 2023 è stata più grande di mezzo milione di Ryzen 9 - letteralmente
Matthew Lee, 2023-12- 9 (Update: 2023-12- 9)