Nvidia ha annunciato la sua architettura computazionale Rubin AI di nuova generazione, che finalmente corrisponderà alla strategia cinese di AI per l'esecuzione dell'inferenza AI a costi molto inferiori rispetto all'attuale edizione Blackwell.
Proprio come l'architettura Nvidia Rubin AI, la piattaforma si basa su sei sottosistemi di elaborazione che lavorano insieme: la CPU Vera, la nuova GPU Nvidia Rubin, lo Switch NVLink 6 di terza generazione, il SuperNIC ConnectX-9, la DPU BlueField-4 e lo Switch Ethernet Spectrum-6. I chip sono costruiti su nodi di fonderia TSMC avanzati e introducono ottimizzazioni dell'interfaccia volte a ridurre drasticamente i costi dei token e la durata della formazione.
In effetti, il "codesign" di Nvidia sui sei nuovi chip consente l'addestramento dei modelli con un quarto delle GPU necessarie nell'attuale piattaforma Nvidia Blackwell e riduce di dieci volte i costi per token. Una riduzione di dieci volte dei costi dei token è ciò che Elon Musk promette per la prossima generazione di Tesla AI5 di Tesla, solo che non entrerà in produzione di massa prima del prossimo anno. Elon Musk ha elogiato Nvidia Rubin come il "motore a razzo per l'AI" che consentirà la distribuzione di modelli edge su scala.
Anche la Cina è orgogliosa del basso Prezzo dei token AI che ottiene grazie all'open-sourcing di modelli come DeepSeek e concatenando molte GPU AI di fascia media come il modello Huawei 910C quindi l'architettura Nvidia Rubin fa finalmente qualcosa per affrontare non solo le prestazioni ma anche i costi di esecuzione dei modelli AI.
Forse la parte più interessante della piattaforma Rubin è la nuova CPU Nvidia Vera,"progettata per il movimento dei dati e il ragionamento agonico attraverso sistemi accelerati, con pieno supporto di calcolo riservato" Può essere abbinata a una GPU Nvidia o funzionare come processore indipendente per l'esecuzione di"carichi di lavoro analitici, cloud, di orchestrazione, di storage e di calcolo ad alte prestazioni (HPC)" con piena compatibilità con Arm.
Le specifiche della CPU Vera includono 88 core personalizzati e 1,2 TB/s di larghezza di banda di memoria LPDDR5X e presentano un consumo energetico molto frugale. L'integrazione dell'interfaccia di connettività NVLink-C2C gestisce l'accesso sincronizzato alla memoria CPU-GPU come parte delle caratteristiche di ottimizzazione che rendono la piattaforma Rubin un ordine di grandezza più efficiente rispetto al suo predecessore basato su Blackwell.
Acquisti il supercomputer personale di intelligenza artificiale Nvidia DGX Spark su Amazon
Fonte(i)
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones






