8 
 
 
 
Avendo scarsa memoria con i titoli, mi sono sempre chiesto perché nessuno si fosse mai 
preoccupato di organizzare le playlists in maniera “spaziale” anziché “testuale”; un po’ come 
faccio io di solito, tenendo le compilation con le canzoni romantiche in cima al raccoglitore (in 
caso di cenetta intima è più facile far colpo se il primo CD in vista è proprio “quello giusto”) e 
quelle con le canzoni da discoteca in fondo (perché dopo la selezione di “Jazz” e “Bossa nova” 
ci vorrà pure qualche canzone dei Village People per scaricare lo stress). Insomma, se un 
sistema per fare tutto ciò non esiste... proverò ad inventarmelo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
                                                         
 
 
                                                                                 9 
 
 
 
CAPITOLO 1 
 
SISTEMI PER LA RICERCA DELLE INFORMAZIONI MUSICALI 
 
1.1 INTRODUZIONE 
 
L’ambito informatico è vitale e in forte espansione. Sempre più persone si trovano a dover 
convivere con i computer, che hanno invaso praticamente tutti i campi del sapere. 
Anche gli studi umanistici utilizzano scanner e fotocamere digitali per archiviare stampe, 
manoscritti, illustrazioni. Tali scienze si avvalgono inoltre di memorie di massa (server con 
dischi rigidi, supporti ottici, ecc.) e di strumenti software per la catalogazione nonché per lo 
stoccaggio degli archivi. 
 
Le macchine sono state create per risolvere problemi quali la conservazione, la trasmissione e 
l’elaborazione dell’informazione, riuscendo ad abbattere drasticamente i tempi e i costi 
solitamente sostenuti per i lavori ripetitivi. Pensiamo all’abisso che divide uno scrivano, il quale 
ricopiava a mano un’opera come ad esempio i Vangeli, dal moderno studente di letteratura che 
con un semplice gesto può trasferire sulla sua chiavetta USB l’intera Bibbia in formato digitale.  
 
Tuttavia le macchine non sempre funzionano bene e anche quando funzionano, non sempre 
danno i risultati attesi. I ricercatori informatici devono stare attenti a creare interfacce semplici 
da usare per non incappare in situazioni paradossali; ciò accade quando lo svolgimento di una 
certa operazione tramite computer richiede più tempo rispetto ai metodi classici, ma anche 
quando l’utilizzo dell’interfaccia è talmente complesso da risultare proibitivo per la maggior 
parte degli utenti. 
 
1.2 SISTEMI DI IR: MODELLO BOOLEANO E MODELLO FUZZY 
 
Il modello più semplice di Information Retrieval (che vuol dire Reperimento delle 
Informazioni) si basa su operatori a due stati, di tipo “0,1” o più semplicemente “vero, falso”. 
Se ad esempio volessimo ricercare il primo canto dell’Inferno di Dante Alighieri all’interno di 
una collezione contenente opere letterarie, dovremmo immettere nel motore di ricerca la stringa 
“Nel mezzo del cammin di nostra vita”: quest’ultimo verificherà eventuali corrispondenze con 
le stringhe di caratteri presenti nel suo database.  
                                                         
 
 
                                                                                 10 
 
 
 
Secondo quanto descritto da Antonella Pizzaleo [PIZ], esperta in multimedialità, ogni sistema 
di Information Retrieval si basa su 4 componenti fondamentali: 
1. un archivio di documenti, in cui il documento è l’unità di informazione reperibile 
2. un meccanismo di indicizzazione e rappresentazione dei documenti, che associa ad ogni 
documento in archivio una descrizione formale e sintetica del suo contenuto informativo 
3. un linguaggio di interrogazione per mezzo del quale un utente esprime le proprie esigenze 
informative (le cosiddette query) 
4. un meccanismo di valutazione (matching) che confronta una query con la rappresentazione 
dei documenti archiviati, allo scopo di verificare quali di questi soddisfano le richieste 
 
Nei sistemi attuali sono spesso implementati sistemi di ricerca fuzzy (ossia sfumati) in cui, oltre 
all’uguaglianza dei contenuti informativi, vengono attribuiti dei pesi anche ai vari gradi di 
similitudine che possono esistere fra elementi diversi. Immaginiamo di cercare in un ipotetico 
catalogo di canzoni la parola “rosa”; di sicuro fra i risultati ci saranno brani come “Una rosa 
blu” o “Notte rosa”, ma un sistema evoluto può anche restituire titoli come “Rose rosse per te” 
o “Grazie dei fior” (in cui una parte del testo recita “son rose rosse e parlano d’amor”) 
basandosi sulle possibili variazioni linguistiche: nel caso fossero contemplati anche brani 
stranieri, due possibili risultati alla nostra query potrebbero essere “Kiss from a rose” o “Bed of 
roses”. Il motore di ricerca potrà quindi fornire in output una pagina html contenente il testo 
della canzone o una versione in Mp3 del brano in modo da poterlo ascoltare. In base allo scopo 
che si vuole ottenere, bisogna assicurarsi che l’informazione restituita all’utente sia non solo del 
tipo desiderato, ma anche che sia presentata in modo gradevole, rispettando le regole 
dell’usabilità [NIE]. 
 
1.3 INTERFACCE PER LA RICERCA DI BRANI MUSICALI 
 
Il ramo scientifico che si occupa di estrarre informazioni inerenti files musicali è detto Music 
Information Retrieval; solitamente, i ricercatori ne parlano usando l'acronimo MIR. Questo 
studio analizzerà vari tipi di interazione, focalizzando l’attenzione sulla categoria a cui 
appartiene ciascuna interfaccia presa in considerazione e su come l’utente si comporta al variare 
delle tipologie. Verranno tralasciati molti aspetti riguardo l’organizzazione e l’indicizzazione 
degli elementi, focalizzando l’attenzione sulle modalità con cui gli utenti si relazionano alle 
applicazioni. Tuttavia in alcuni casi sarà necessario spendere qualche parola in più per capire 
                                                         
 
 
                                                                                 11 
 
 
 
quanto i due aspetti siano correlati, soprattutto quando verrà analizzato il software sviluppato 
all’interno del LIM. 
 
1.3.1 PANORAMICA: INTERFACCE TESTUALI 
 
Sono state individuate finora 4 macroaree corrispondenti al modo in cui, soprattutto nei servizi 
on-line, avvengono le operazioni di immissione delle richieste: 
- Interfacce testuali 
- Interfacce parametriche 
- Interfacce grafiche 
- Interfacce sonore 
 
Le prime includono programmi di uso comune come eMule [emu], software di scambio files 
che si basa sul concetto del P2P (ossia Peer to Peer ; uno stesso utente funge da client quando 
scarica i files, ma anche da server se i brani presenti nella sua cartella condivisa vengono 
richiesti da altri utenti). 
 
 
Figura 1.1: una schermata di ricerca tramite eMule 
 
                                                         
 
 
                                                                                 12 
 
 
 
Un servizio interessante è quello offerto dal sito di Pandora [pan], che permette di creare delle 
playlists partendo da un input di tipo testuale (ad esempio, un fan di Freddie Mercury potrebbe 
digitare la parola “Queen”). Pandora provvederà a suggerire altre canzoni in cui viene 
riscontrata similarità rispetto alla prima scelta dell’utente, basandosi su “etichette” riguardanti 
ritmo, densità tonale, estensione del cantato. Il  sistema di catalogazione alla base del servizio 
[mgp] è complesso; lascio ad altri la trattazione dell’argomento. 
 
La creazione di una playlist avviene in tempo reale e spesso dà risultati soddisfacenti, ma non è 
possibile un confronto oggettivo con altri sistemi di interazione in quanto è impossibile avere 
dati sia quantitativi che qualitativi sulla collezione musicale da cui l’interfaccia estrapola le 
informazioni. Attualmente, per motivi di gestione dei diritti d’autore, il servizio è fruibile 
soltanto dagli utenti che si collegano tramite provider in USA.   
 
 
Figura 1.2: la schermata iniziale di ricerca di Pandora 
 
 
Figura 1.3: Pandora permette di sapere “perché sta suonando questa canzone” 
                                                         
 
 
                                                                                 13 
 
 
 
1.3.2 INTERFACCE PARAMETRICHE 
 
Alcuni servizi internet permettono di ricercare musica attraverso parametri riconducibili ad uno 
“spazio musicale multidimensionale”. Il sito di Playola [pla] incorpora un browser composto da 
un riquadro sulla parte destra dello schermo - in cui compaiono i parametri (Rap, Country, ecc.) 
assieme ad una barra indicante il valore dei parametri stessi, nonché i comandi “More” e “Less” 
– e da un secondo riquadro sottostante, in cui vengono visualizzati i brani più “vicini” rispetto 
allo spazio multidimensionale selezionato. E’presente anche la possibilità di segnare i brani 
trovati come “good match” o “bad match” (già vista anche in Pandora alla Fig.1.3 sotto forma 
di icone: pollice in alto e pollice in basso) per affinare le selezioni successive. Playola 
implementa infine una funzione di playlist che tiene traccia degli ultimi brani richiesti 
dall’utente. Una piccola curiosità: il nome payola [FAB] indica la pratica, da molti considerata 
illegale, con cui le case discografiche pagano i “Disc jockey” affinché trasmettano in radio le 
nuove canzoni da promuovere. In effetti anche qui vengono proposti dei brani con lo scopo di 
venderli successivamente on-line; si spiega così il gioco di parole. 
 
 
  
Figura 1.4: l’interfaccia di Playola 
                                                         
 
 
                                                                                 14 
 
 
 
1.3.3 INTERFACCE GRAFICHE 
 
Le applicazioni che utilizzano un’interfaccia grafica per ricercare e visualizzare informazioni 
musicali sono quelle attualmente in fase di grande sviluppo. Questo per vari motivi: 
- Il forte “appeal” che suscitano delle interfacce ben curate nei confronti degli utenti 
- L’intuitività del loro utilizzo, in grado di competere con le interfacce testuali 
- Lo stimolo “ludico” che deriva dalla visione e dall’interazione 
 
Una riflessione doverosa è questa: perché il programma più diffuso per la riproduzione di 
musica, Windows Media Player, incorpora così tante skin nonché “effetti grafici” (alcuni dai 
nomi davvero strani come ad esempio “Spider’s last moment...”, “Green is not your enemy”, 
“My tornado is resting”), oltre a varie opzioni che permettono di personalizzare i colori 
dell’interfaccia software? La risposta è che l’utente così può avvalersi di stimoli piacevoli sia 
dal punto di vista uditivo (la musica che sta ascoltando) sia da quello visivo, scegliendo “cosa 
guardare”. 
Avremo modo, nei prossimi paragrafi, di notare come questi abbellimenti grafici servano anche 
a mascherare i punti deboli del software. 
 
1.3.3.1  MUSICLENS 
 
Questo servizio [mus], permette di scegliere fra numerosi parametri tramite degli sliders simili a 
quelli di un mixer. Il dettaglio fondamentale che mi ha fatto collocare il servizio in questa 
categoria è che, pur essendo simile a Playola, nella schermata compare un grafico in alto a 
sinistra: in base ad ogni slider attivato, viene evidenziato un settore dell’area totale che appare 
piatto per valori dello slider uguali a 0 (posizione centrale); tale settore apparirà convesso 
(come un “rilievo montuoso”) quando lo slider relativo assume valori positivi e concavo 
quando assume valori negativi. L’utilità è duplice: da un lato, si può intuitivamente capire quale 
parametro influisce maggiormente sulla ricerca (il “monte” più alto o il “dirupo” più ripido), 
dall’altro è più facile memorizzare un “panorama” di questo tipo che ricordare i valori dei 
singoli potenziometri. Infine, i valori attribuibili agli slider danno una sensazione di continuità a 
differenza dei parametri presenti in Playola, a cui si possono attribuire solo valori discretizzati 
in base ad una scala. E’ da notare poi l’utilizzo di parametri legati al mood: 
 
                                                         
 
 
                                                                                 15 
 
 
 
- Purpose: lo “scopo” per cui si vuole ascoltare musica. Fra i valori di riferimento 
compaiono i termini “Listening”, “Driving”, “Sex”, “Dance”. 
- Mood: lo stato d’animo dell’utente. Fra i valori possibili troviamo “Angry”, “Sad”, 
“Normal”, “Smile”. 
- Colour: una barra in cui è possibile selezionare un qualsiasi colore dello spettro 
visibile. E’ probabilmente legata ad una convenzione sinestetica stabilita dai 
programmatori (un’ipotesi potrebbe essere: rosso = musica allegra, blu = musica 
rilassante).  
 
Anche in questo caso la musica si conferma un fenomeno multidimensionale, in cui vengono 
stabilite correlazioni fra parametri oggettivi, come ad esempio la densità tonale o la velocità 
ritmica espressa in Bpm (acronimo di Beats per Minute - pulsazioni al minuto) e parametri 
percettivi come la ritmicità, l’allegria, la rumorosità di un brano. 
 
 
Figura 1.5: la veste grafica di MusicLens 
 
 
                                                         
 
 
                                                                                 16 
 
 
 
1.3.3.2  MUSICREAM 
 
Navigando sul web, mi sono imbattuto nel video dimostrativo di un software davvero 
interessante. Anche se, per adesso, non è previsto un suo utilizzo on-line, mi sembra giusto 
parlarne. Musicream, presentato all’ISMIR 2005 [Got], viene definita come “New music 
playback interface for streaming, sticking, sorting and recalling musical pieces”. In effetti, 
l’applicazione sviluppata da Takayuki e Masataka Goto (cognome che ricorda un’istruzione in 
Basic) riesce a gestire brani e playlists in maniera intuitiva. Vediamo nel dettaglio come 
funziona: ci sono 3 “rubinetti” in alto a destra nella schermata iniziale. E’ possibile selezionare 
un’apertura diversa per ciascun rubinetto: maggiore è l’apertura e maggiore sarà la frequenza 
con cui le “gocce” scenderanno. Ogni goccia rappresenta un brano musicale; quando il 
puntatore del mouse scorre sopra un brano, la goccia si ingrandisce e permette di visualizzare il 
nome dell’artista e il titolo della canzone.  
 
 
Figura 1.6: le “gocce” e la visualizzazione delle informazioni del brano 
 
Trascinando una goccia sul lato sinistro dello schermo, possiamo ascoltare la canzone: in