Notebookcheck Logo

Grok 4 batte ChatGPT e diventa il primo modello pubblico di AI, mentre Elon Musk annuncia un abbonamento premium da 300 dollari al mese

Il logo del modello linguistico Grok 4 AI. (Fonte: xAI)
Il logo del modello linguistico Grok 4 AI. (Fonte: xAI)
Il nuovo Grok 4 di xAI di Elon Musk è ora il miglior modello di AI disponibile al pubblico, secondo le piattaforme di test di terze parti, battendo ChatGPT o Gemini di Google. Il team xAI ha introdotto anche una nuova e costosa opzione di abbonamento all'AI chiamata Grok 4 Heavy.

A poco più di due anni dal suo rilascio, Grok di xAI è diventato il modello di linguaggio AI leader, superando ChatGPT di OpenAI, Gemini di Google o DeepSeek, oltre a Meta e Anthropic. Grok arriverà sulle auto Tesla la prossima settimana, ha dichiarato Elon Musk.

Secondo i test di terze parti indipendenti, il nuovo Grok 4 è ora in cima alla classifica delle prestazioni dei modelli AI pubblici. La forza trainante del miglioramento di 10 volte nel ragionamento tra Grok 3 e Grok 4 sono stati i cluster di calcolo dell'AI che xAI ha costruito a rotta di collo, raddoppiandoli a 200.000 GPU sulla strada verso il milione previsto.

Il team di xAI ha contattato i responsabili dell'esigente test di prestazioni ARC-AGI e ha chiesto loro di eseguire le loro suite di test AI, con risultati sorprendenti:

Innanzitutto, i fatti: Grok 4 è ora il modello con le migliori prestazioni disponibili pubblicamente su ARC-AGI. Questo supera persino le soluzioni create ad hoc presentate su Kaggle. In secondo luogo, ARC-AGI-2 è difficile per gli attuali modelli di AI. Per ottenere un buon punteggio, i modelli devono imparare una mini-abilità da una serie di esempi di addestramento, e poi dimostrare tale abilità al momento del test. Il precedente punteggio massimo è stato di ~8% (da Opus 4). Sotto il 10% è rumoroso. Se il 15,9% supera la barriera del rumore, Grok 4 mostra livelli non nulli di intelligenza fluida

Un altro tester di AI indipendente, Artificial Analysis, ha dichiarato di aver"eseguito la nostra suite completa di benchmark e Grok 4 ha raggiunto un Indice di Intelligenza di Artificial Analysis di 73, davanti a OpenAI o3 a 70, Google Gemini 2.5 Pro a 70, Anthropic Claude 4 Opus a 64 e DeepSeek R1 0528 a 68"

Secondo Elon Musk nella presentazione del rilascio di Grok 4, il modello di xAI è ora più intelligente di tutti gli studenti laureati in tutte le discipline messe insieme. Con la sua tipica spocchia, l'amministratore delegato di Tesla ha affermato che Grok 4 sarà in grado di scoprire "nuove tecnologie" come farmaci o innovazioni ingegneristiche da solo il prossimo anno.

Tuttavia, ha ammesso che Grok sarà ancora pessimo nel riconoscimento delle immagini per il prossimo mese o giù di lì, e ha affrontato la recente controversia sulle risposte suprematiste https://www.bbc.com/news/articles/c4g8r34nxeno dicendo che"quando Grok va male, di solito è dovuto a qualcosa di stupido che abbiamo fatto, come un prompt di sistema sbagliato, o l'attribuzione di un peso eccessivo a fonti parziali"

Musk deve pompare Grok 4, perché la sua xAI sta introducendo per la prima volta un livello premium a pagamento. Chiamato SuperGrok Heavy, parte da 300 dollari al mese e include ciò che è contenuto nel livello SuperGrok da 30 dollari al mese, che dà accesso iniziale a Grok 4, oltre all'accesso alla piattaforma Grok 4 Heavy che offre limiti di tariffa più elevati e accesso anticipato a nuove funzionalità.

Grok 3 rimarrà gratuito per il pubblico in generale, mentre ogni abbonato a X Premium+ includerà l'accesso a Grok 4 nel livello SuperGrok.

Grafico delle prestazioni storiche dei modelli Grok vs ChatGPT vs Gemini AI.
Grafico delle prestazioni storiche dei modelli Grok vs ChatGPT vs Gemini AI.
Classifica dei migliori modelli AI.
Classifica dei migliori modelli AI.

Fonte(i)

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 07 > Grok 4 batte ChatGPT e diventa il primo modello pubblico di AI, mentre Elon Musk annuncia un abbonamento premium da 300 dollari al mese
Daniel Zlatev, 2025-07-10 (Update: 2025-07-10)