UNIVERSITA' DEGLI STUDI DI MILANO - Facoltà di Scienze Matematiche, Fisiche e Naturali - Corso di Laurea in Scienze dell'informazione

 

Un sistema prototipale per la sintesi di processi musicali guidata dall'analisi di forme grafiche

Tesi di Laurea di Marco Solinas Matr. 433947

 

 

 

Il lavoro svolto in questa tesi riguarda lo studio dei rapporti tra immagine e suono.
In questo campo, sono state realizzate numerose ricerche, alcune delle quali al L.I.M., allo scopo di trovare un legame profondo tra il mondo visivo e quello sonoro, che vada oltre la semplice sincronizzazione di eventi musicali e immagini. Alcune ricerche hanno avuto come obiettivo la descrizione di brani musicali attraverso una rappresentazione grafica diversa da quella tradizionale su pentagramma; altre si sono avvalse di immagini per generare processi sonori.
Questo studio intende offrire un contributo alla ricerca del legame tra mondo visivo e sonoro. A tal fine è stato realizzato un programma in grado di generare dall'analisi di un'immagine delle sequenze musicali, che forniscano una descrizione sonora dell'immagine stessa. Tale descrizione riguarda gli aspetti qualitativi dell'immagine, e cerca di stabilire una corrispondenza a livello percettivo tra elementi grafici e oggetti sonori.
Il programma è diviso in due parti principali: una dedicata all'elaborazione dell'immagine, l'altra alla generazione del suono.
L'elaborazione inizia col caricamento in memoria di un'immagine a 256 colori in formato PICT e di dimensione massima di 400x400 pixel. L'elaborazione ha lo scopo di individuare, all'interno dell'immagine, delle forme geometriche e di determinarne le principali caratteristiche grafiche. Gli oggetti riconosciuti sono cerchi, rettangoli, triangoli, rette e archi; e i parametri grafici considerati sono il tipo di oggetto, la posizione nel piano, il colore e la dimensione.
Il riconoscimento avviene utilizzando l'algoritmo del gradiente, che permette di ottenere un'immagine binaria in cui i pixel significativi sono quelli appartenenti al contorno dell'immagine. Si applicano, poi, algoritmi di pattern matching, che operano sui pixel del contorno, utilizzando, per il riconoscimento, un modello dell'oggetto da cercare (cioè una matrice rappresentante i contorni dell'oggetto).
Al termine dell'elaborazione viene creata una lista i cui elementi contengono le informazioni relative agli oggetti trovati. Il programma dà la possibilità di salvare su disco questi risultati utilizzando un formato di archiviazione proprietario.
Terminata l'elaborazione dell'immagine, è possibile associare ad ogni elemento grafico un oggetto sonoro, determinando i parametri sonori in base alle caratteristiche grafiche degli elementi.
E' stato necessario, quindi, stabilire delle regole che permettessero di realizzare questa associazione in modo completamente automatico; regole, cioè, che siano utilizzabili da un calcolatore. La trasformazione dei parametri grafici in parametri sonori (timbro, frequenza, intensità, durata) viene fatta in modo che riesca il più possibile intuitiva. Per esempio la lunghezza delle linee è proporzionale alla durata del suono e la dimensione all'intensità. Si è cercato, inoltre, di generare suoni il cui ascolto abbia una corrispondenza a livello sensoriale con l'osservazione dell'immagine. Per questo scopo è stata molto utile la teoria della forma sviluppata da Kandinsky nel libro "Punto, linea e superficie".
La scelta delle regole è stata inevitabilmente arbitraria, per questo è stata data la possibilità all'utente di modificarle parzialmente, in particolare per le corrispondenze più soggettive come l'associazione tra colori e timbri, e tra tonalità e colore di fondo.
Per ogni oggetto grafico viene, quindi, generato un oggetto sonoro.
Terminata questa operazione, il programma associa all'immagine una sequenza musicale formata dai suoni associati agli oggetti. Questa sequenza può essere ottenuta ordinando la lista degli oggetti secondo tre criteri diversi.
Il primo consiste nell'operare una scansione dell'immagine da sinistra a destra e dall'alto in basso e inserendo gli oggetti nella nuova lista ordinata non appena questi vengono incontrati; il secondo criterio consiste nell'operare la scansione partendo dal centro dell'immagine e proseguendo verso i lati. L'ultima possibilità è quella di inserire per primi gli oggetti più grandi e con i colori più vivaci, in modo da simulare la sequenza di osservazione dell'immagine; normalmente, infatti, gli oggetti più grandi e colorati vengo visti per primi.
La scelta del criterio da usare viene lasciata all'utente.
Determinata la sequenza, l'immagine viene ridisegnata sullo schermo, un oggetto alla volta, seguendo l'ordine della lista, e contemporaneamente riprodotto il suono dell'oggetto, realizzando una performance grafico-musicale. A questo scopo il programma è in grado di pilotare dispositivi MIDI per la sintesi del suono.