Notebookcheck Logo

Yandex rilascia il dataset di raccomandazione musicale open-source Yambda

Il dataset gratuito Yahdex Yambda consente a chiunque di creare il proprio servizio di raccomandazione musicale. (Fonte: Yandex)
Il dataset gratuito Yahdex Yambda consente a chiunque di creare il proprio servizio di raccomandazione musicale. (Fonte: Yandex)
Yandex ha rilasciato Yambda, il più grande set di dati aperti al mondo per i sistemi di raccomandazione musicale, contenente 4,79 miliardi di interazioni anonime degli utenti per aiutare gli sviluppatori a creare servizi musicali intelligenti che riproducono solo le canzoni che gli ascoltatori vogliono ascoltare.

Yandex ha rilasciato il suo set di dati open-source Yambda, contenente informazioni sulle preferenze degli ascoltatori di musica, da utilizzare per la creazione di un servizio di streaming audio simile a Spotify con personalizzazione delle playlist tramite AI.

I servizi di streaming come Spotify, Tidal e Qobuz utilizzano algoritmi software o modelli AI per creare playlist basate sulle preferenze individuali. Questi servizi in genere non rilasciano il loro codice o i loro modelli, perché la loro capacità unica di riprodurre automaticamente le canzoni che piacciono agli ascoltatori è considerata un segreto commerciale del loro successo.

Yandex ha raccolto dati in dieci mesi sotto forma di 4,79 miliardi di interazioni di utenti con 9,39 milioni di brani musicali dal suo pool di 28 milioni di utenti mensili di Yandex Music utenti. Questo include un feedback chiave da parte degli ascoltatori di Yandex Music: cosa scelgono di ascoltare e cosa piace e non piace. Tutte le interazioni sono marcate temporalmente per una maggiore precisione.

Il set di dati può essere scaricato nelle dimensioni di cinque miliardi (1 milione di utenti), cinquecento milioni (100.000 utenti) e cinquanta milioni (10.000 utenti) di modelli di eventi, con il massimo che richiede almeno 85 GB di spazio di archiviazione. Il set di dati è archiviato nel formato Apache Parquet un formato di file di dati orientato alle colonne per facilitare l'analisi e la ricerca.

I lettori possono regalare la musica in streaming con una carta regalo Spotify.

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 05 > Yandex rilascia il dataset di raccomandazione musicale open-source Yambda
David Chien, 2025-05-30 (Update: 2025-05-30)