A poco più di due anni dal suo rilascio, Grok di xAI è diventato il modello di linguaggio AI leader, superando ChatGPT di OpenAI, Gemini di Google o DeepSeek, oltre a Meta e Anthropic. Grok arriverà sulle auto Tesla la prossima settimana, ha dichiarato Elon Musk.
Secondo i test di terze parti indipendenti, il nuovo Grok 4 è ora in cima alla classifica delle prestazioni dei modelli AI pubblici. La forza trainante del miglioramento di 10 volte nel ragionamento tra Grok 3 e Grok 4 sono stati i cluster di calcolo dell'AI che xAI ha costruito a rotta di collo, raddoppiandoli a 200.000 GPU sulla strada verso il milione previsto.
Il team di xAI ha contattato i responsabili dell'esigente test di prestazioni ARC-AGI e ha chiesto loro di eseguire le loro suite di test AI, con risultati sorprendenti:
Innanzitutto, i fatti: Grok 4 è ora il modello con le migliori prestazioni disponibili pubblicamente su ARC-AGI. Questo supera persino le soluzioni create ad hoc presentate su Kaggle. In secondo luogo, ARC-AGI-2 è difficile per gli attuali modelli di AI. Per ottenere un buon punteggio, i modelli devono imparare una mini-abilità da una serie di esempi di addestramento, e poi dimostrare tale abilità al momento del test. Il precedente punteggio massimo è stato di ~8% (da Opus 4). Sotto il 10% è rumoroso. Se il 15,9% supera la barriera del rumore, Grok 4 mostra livelli non nulli di intelligenza fluida
Un altro tester di AI indipendente, Artificial Analysis, ha dichiarato di aver"eseguito la nostra suite completa di benchmark e Grok 4 ha raggiunto un Indice di Intelligenza di Artificial Analysis di 73, davanti a OpenAI o3 a 70, Google Gemini 2.5 Pro a 70, Anthropic Claude 4 Opus a 64 e DeepSeek R1 0528 a 68"
Secondo Elon Musk nella presentazione del rilascio di Grok 4, il modello di xAI è ora più intelligente di tutti gli studenti laureati in tutte le discipline messe insieme. Con la sua tipica spocchia, l'amministratore delegato di Tesla ha affermato che Grok 4 sarà in grado di scoprire "nuove tecnologie" come farmaci o innovazioni ingegneristiche da solo il prossimo anno.
Tuttavia, ha ammesso che Grok sarà ancora pessimo nel riconoscimento delle immagini per il prossimo mese o giù di lì, e ha affrontato la recente controversia sulle risposte suprematiste https://www.bbc.com/news/articles/c4g8r34nxeno dicendo che"quando Grok va male, di solito è dovuto a qualcosa di stupido che abbiamo fatto, come un prompt di sistema sbagliato, o l'attribuzione di un peso eccessivo a fonti parziali"
Musk deve pompare Grok 4, perché la sua xAI sta introducendo per la prima volta un livello premium a pagamento. Chiamato SuperGrok Heavy, parte da 300 dollari al mese e include ciò che è contenuto nel livello SuperGrok da 30 dollari al mese, che dà accesso iniziale a Grok 4, oltre all'accesso alla piattaforma Grok 4 Heavy che offre limiti di tariffa più elevati e accesso anticipato a nuove funzionalità.
Grok 3 rimarrà gratuito per il pubblico in generale, mentre ogni abbonato a X Premium+ includerà l'accesso a Grok 4 nel livello SuperGrok.
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones