Notebookcheck Logo

La startup coreana afferma che il suo 'scienziato AI' supera Gemini 2.5 Pro e Claude Opus 4

Un'immagine illustrativa di come Scinapse si confronta con la concorrenza (Fonte: Google, Anthropic e Pluto Labs; modifica)
Un'immagine illustrativa di come Scinapse si confronta con la concorrenza (Fonte: Google, Anthropic e Pluto Labs; modifica)
In un nuovo e sorprendente sviluppo, Pluto Labs ha affermato che la sua AI Scinapse supera i modelli di Google e Anthropic a una frazione del costo. L'annuncio ha suscitato un grande scalpore nel settore, mentre il mondo attende il lancio ufficiale e la convalida indipendente.

Nella corsa alla costruzione di un vero 'scienziato AI', la startup coreana ha annunciato un nuovo modello che, a suo dire, raggiunge prestazioni superiori a un decimo del costo computazionale dei suoi concorrenti. Scinapse AI di Pluto Labs sfida l'idea che il successo nell'AI avanzata richieda una potenza di calcolo massiccia e brutale.

Pluto Labs afferma che la chiave del suo successo è l'architettura "Strategic Efficiency": Scinapse AI delega i compiti ad alta intensità di dati, come le analisi della letteratura, alla sua piattaforma di ricerca accademica esistente. Questo design consente all'AI principale di concentrarsi esclusivamente sul ragionamento creativo e sulla generazione di idee nuove e testabili.

Sulla base di un test cieco autodichiarato, l'azienda vanta che la sua AI si è classificata costantemente al primo posto in "Plausibilità" e "Testabilità" rispetto ai modelli top di Google e Anthropic su 61 diversi argomenti scientifici. Pluto Labs sostiene che questo dimostra che la sua IA fornisce una "ricerca scientifica fattibile" piuttosto che una "finzione plausibile". Per combattere l'allucinazione dell'AI, si dice che il sistema sia strettamente legato a un database di 260 milioni di documenti accademici. I test alla cieca sono stati giudicati da 3 modelli di AI concorrenti: Gemini 2.5 Pro, Clause Opus 4 e OpenAI o3.

Il fatto che una piccola startup coreana si sia dimostrata superiore a Google in un benchmark oggettivo è più di un semplice risultato tecnico: è un evento simbolico per la leadership innovativa. - Simon Kim, CEO di Hashed.

Pluto Labs prevede un lancio globale per Scinapse AI nel corso di questo trimestre. La comunità tecnologica seguirà da vicino i benchmark indipendenti che convalideranno le audaci affermazioni dell'azienda.

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 07 > La startup coreana afferma che il suo 'scienziato AI' supera Gemini 2.5 Pro e Claude Opus 4
Chibuike Okpara, 2025-07-17 (Update: 2025-07-17)