DeepSeek ha presentato l'ultima versione del suo rivoluzionario modello linguistico R1 AI large, DeepSeek-R1-0528. L'azienda ha fatto irruzione nel mondo dell'AI con il lancio dei suoi modelli V3 e R1, entrambi con prestazioni AI top-ten https://lmarena.ai/leaderboard ma si sono formati in modo più economico, impiegando meno tempo rispetto ai modelli concorrenti di aziende come OpenAI e Google.
L'ultimo modello R1 è stato testato con i seguenti benchmark di AI:
- American Invitational Mathematics Examination (AIME) 2024
- American Invitational Mathematics Examination (AIME) 2025
- Google-Proof Q&A (GPQA)
- LiveCodeBench
- Codifica Aider AI
- L'ultimo esame dell'umanità
Sebbene DeepSeek-R1-0528 abbia migliorato le prestazioni rispetto alla versione R1 originale in tutti i benchmark, risponde correttamente solo al 17% delle domande del difficile https://lastexam.ai/. Dal momento che anche i suoi principali concorrenti ottengono punteggi bassi in questo esame, i guadagni dell'ultima versione di DeepSeek R1 derivano probabilmente da un tempo di addestramento e di messa a punto dell'AI supplementare, piuttosto che da un'innovazione nella creazione dell'AI. È importante notare che l'ultima versione R1 ha ridotto le allucinazioni dell'IA, quindi è meno probabile che generi risposte fuorvianti o false.
I lettori che desiderano armeggiare con il modello R1 open-source possono eseguire versioni distillate da otto miliardi di parametri utilizzando una GPU Nvidia 4090 con 24 GB di memoria.
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones