Tencent presenta quattro modelli compatti di Hunyuan open-source con parametri da 0,5B, 1,8B, 4B e 7B

Tencent ha reso open-source il suo modello Hunyuan AI, rilasciando quattro modelli linguistici compatti open-source (Fonte: Tencent)

Tencent ha reso open-sourced il suo modello Hunyuan AI, rilasciando quattro modelli linguistici compatti con 0,5 miliardi, 1,8 miliardi, 4 miliardi e 7 miliardi di parametri che possono essere eseguiti su una singola GPU consumer.

Nathan Ali (traduzione a cura di Ninh Duy), Pubblicato 08/04/2025 🇺🇸 🇪🇸 ...

AI Open Source Chinese Tech

Tencent ha rilasciato una nuova suite di modelli Hunyuan compatti: 0.5 miliardi, 1,8 miliardi, 4 miliardi e 7 miliardi di parametri; sono destinati a implementazioni a basso consumo e ai bordi. Tutte e quattro le configurazioni sono ora disponibili su GitHub e Hugging Face, e ognuna può eseguire l'inferenza su una singola scheda grafica di livello consumer, rendendole adatte a computer portatili, smartphone, sistemi smart-cabin e altri hardware con risorse limitate.

Nonostante le dimensioni ridotte, i modelli ottengono punteggi di primo piano nella comprensione del linguaggio, nella matematica e nel ragionamento in diversi benchmark pubblici. Tencent attribuisce questi risultati a un'architettura di "ragionamento fusion" che consente agli utenti di scegliere tra una modalità di pensiero veloce per risposte concise e una modalità di pensiero lento per ragionamenti più elaborati a più fasi.

Una caratteristica tecnica chiave è la finestra di contesto nativa da 256K token, sufficiente per ingerire circa 500.000 parole inglesi in un solo passaggio. Tencent sottolinea le applicazioni interne come Tencent Meeting e WeChat Reading, dove i modelli possono analizzare un'intera trascrizione di una riunione o un libro completo in una sola volta, mantenendo le relazioni tra i personaggi e i dettagli della trama per le query a valle.

I quattro LLM compatti si integrano con i principali framework di inferenza, tra cui SGLang, vLLM e TensorRT-LLM, e supportano diversi formati di quantizzazione. Le prime approvazioni da parte di Arm, Qualcomm, Intel e MediaTek indicano i prossimi pacchetti di distribuzione ottimizzati per i rispettivi processori client.

I primi casi d'uso sottolineano il focus pratico della release. Tencent Mobile Manager riferisce di un'intercettazione dello spam a livello di millisecondo senza trasferimento di dati fuori dal dispositivo. Allo stesso tempo, uno schema a doppio modello nell'assistente di cabina intelligente di Tencent bilancia il consumo di energia a bordo con la profondità della conversazione. Questi esempi, sostiene Tencent, dimostrano che i modelli di piccole dimensioni possono offrire capacità di agente di livello aziendale, se progettati con attenzione.

Fonte(i)

Tecnologia veloce (in cinese)

Articoli collegati

⟨

BMW vuole battere la Tesla Model Y: il SUV di riferimento iX3 offre un'autonomia maggiore e i comfort della Neue Klasse

Lancio del nuovo caricatore Nexode 100W di Ugreen con cavo retrattile

⟩

Add as a preferred source on Google

Editor of the original article: Nathan Ali - Tech Writer - 361 articles published on Notebookcheck since 2024

contact me via: @Painite6

Translator: Ninh Ngoc Duy - Editorial Assistant - 788796 articles published on Notebookcheck since 2008

contact me via: Facebook

> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 08 > Tencent presenta quattro modelli compatti di Hunyuan open-source con parametri da 0,5B, 1,8B, 4B e 7B

Nathan Ali, 2025-08- 4 (Update: 2025-08- 5)