Ecco come Spotify comprende cosa ci piace ascoltare

Ogni lunedì mattina oltre 400 milioni di utenti Spotify trovano una nuova playlist personalizzata chiamata Discover Weekly. Un mixtape di 30 canzoni che porta gli ascoltatori alla scoperta di nuovi artisti e nuovi brani con un’alta probabilità di incontrare i loro gusti musicali.

È il modo con cui Spotify personalizza il proprio servizio cucendolo su misura sulle preferenze dei suoi utenti. Da quando è stata lanciata nel 2015 è diventata tra le funzionalità più apprezzate, spingendo la piattaforma di streaming a ricalibrare il proprio focus e ad investire più risorse nelle playlist basate sugli algoritmi.

Ma come fa Spotify a incontrare i gusti dei singoli utenti in modo molto più accurato di qualsiasi altro servizio?

Per determinare le preferenze delle persone e creare Discover Weekly, la piattaforma di streaming utilizza tre principali modelli di raccomandazione:

Collaborative Filtering

Natural Language Processing

Raw Audio

 

Collaborative Filtering

Spotify raccoglie una serie di feedback impliciti, come il numero delle riproduzioni dei singoli brani, il salvataggio delle tracce nelle playlist e il numero di visite ai profili degli artisti, per fare una comparazione dei gusti musicali tra più persone. Una volta che il sistema trova una corrispondenza tra due utenti con interessi musicali simili consiglierà all’utente A i brani che non ha mai ascoltato e sui quali invece l’utente B ha espresso un interesse, e viceversa. Il sistema può risultare semplice da un punto di vista binario, ma gli algoritmi di Spotify devono incrociare i dati di oltre 400 milioni di utenti con un database di più di 80 milioni di brani.

NLP

Il secondo modello si basa invece sull’elaborazione del linguaggio naturale, ovvero la capacità degli algoritmi di Intelligenza Artificiale di comprendere il linguaggio umano. Spotify esegue costantemente la scansione del Web alla ricerca di post e articoli che parlano di musica cercando gli aggettivi e le parole che vengono frequentemente associati a determinati artisti e brani, e quali altri artisti o tracce vengono discussi tra loro. Ogni artista e canzone ha migliaia di tag principali che cambiano ogni giorno. Ad ogni tag viene associato un peso, che corrisponde alla probabilità che qualcuno descriva un brano o un artista con quel tag specifico. Quindi il modello NLP utilizza queste etichette e pesi per creare una rappresentazione vettoriale della traccia che può essere utilizzata per determinare se due brani musicali siano “simili”.

Raw Audio

Questo modello serve a Spotify per migliore ulteriormente la precisione del suo sistema di raccomandazione. Infatti, a differenza dei due modelli precedenti, la comparazione delle tracce prende in considerazione brani inediti e poco conosciuti che sfuggono sia all’analisi del “filtraggio collaborativo” (pochi ascoltatori) sia ai modelli di PNL (poche menzioni su internet). Per elaborare i dati audio grezzi si utilizzano le reti neurali convoluzionali che effettuano una complessa analisi delle caratteristiche chiave di ogni singolo brano. Questa “lettura” consente a Spotify di comprendere le somiglianze fondamentali tra i brani e quindi quali utenti potrebbero apprezzarli, in base alla propria cronologia di ascolto.

Questi sono i principali modelli che alimentano la pipeline di raccomandazione di Spotify, così come la tanto apprezzata Discovery Weekly. Non ci resta che aspettare lunedì prossimo per scoprire la nuova selezione di brani cucita su misura per ognuno di noi.

AUTORE:Data Masters Apri profilo LinkedIn

Data Masters è una Tech Academy che offre percorsi di formazione nei settori della Data Science, del Machine Learning e dell’Intelligenza Artificiale. I nostri corsi di formazione sono progettati per applicare immediatamente l’Intelligenza Artificiale in ogni settore lavorativo e accompagnare aziende e professionisti in percorsi di upskilling e reskilling.