Strumenti per l'identificazione di strutture
nelle vocalizzazioni infantili
Tesi di laurea di: Franco Ambrosi Matr.: 309105
Relatore: Prof. Goffredo Haus Correlatore: Prof. Mario Italiani
Anno Accademico: 1992/93
Questa tesi si è svolta presso il Laboratorio di Informatica
Musicale del Dipartimento di Scienze dell'Informazione, in collaborazione
con alcuni ricercatori del D.S.I., dell'Istituto di Psicologia
e dell'Istituto di Neuropsichiatria Infantile della Facoltà
di Medicina dell'Università degli Studi di Milano.
Essa nasce dalla necessità di fornire ai ricercatori uno
strumento per l'analisi del pianto neonatale in grado di evidenziare
i caratteri salienti di questo tipo di segnale, tale da fornire
una buona risposta sia relativamente alle caratteristiche individuali
che allo stato di salute del neonato.
Il pianto è il segnale acustico di maggior rilevanza biologica
nei primi mesi di vita. Finora ne sono stati individuati 80 tipi
diversi, quindi è possibile ipotizzare l'esistenza di una
quantità discreta di stati emozionali e motivazionali,
che si trovino entro un triangolo i cui vertici sono "nascita",
"fame", "dolore". In letteratura esistono
inoltre delle relazioni accertate fra tipo di patologia (Down,
iperbilirubinemia, nascita prematura, assorbimento di sostanze
stupefacenti) e il pianto. Si è resa pertanto necessaria
la progettazione di uno strumento diagnostico che in quanto tale
doveva soddisfare le seguenti proprietà:
1o Interfaccia utente chiara, ordinata e curata anche nell'aspetto.
2o Estrema facilità d'uso e ridotti tempi di training.
3o Buona discriminazione fra i vari tipi di pianto.
4o Velocità, robustezza e precisione.
La ricerca di una soluzione per l'ultimo punto è stata
particolarmente lunga e delicata per l'incompatibilità
delle proprietà richieste, tenendo conto anche del fatto
che le registrazioni in una nursery potevano essere effettuate
in condizioni precarie e in presenza di parecchio rumore. Dopo
aver passato in rassegna i metodi d'analisi del segnale nel dominio
del tempo e delle frequenze, per verificare quale potesse dare
maggiori garanzie di discriminazione e robustezza, ho accertato
che il parametro più efficace nella rappresentazione del
segnale neonatale è l'andamento della frequenza fondamentale
delle componenti vocaliche, noto come pitch.
Fra gli strumenti teorici utilizzabili per la ricerca del pitch,
si è dimostrato particolarmente robusto quello basato sulle
matrici di co-occorrenza, istogrammi bidimensionali di coppie
di ampiezze di campioni distanti un certo valore k l'uno dall'altro.
Il metodo originale si basava sull'equiparazione del segnale a
una serie di pattern statistici, dove la periodicità era
cercata testando l'ipotesi di indipendenza statistica delle coppie
di ampiezze di campioni e le ampiezze erano viste come possibili
valori di due variabili casuali. Il metodo era efficace ma lento,
dovendo calcolare molte matrici; inoltre il test d'ipotesi richiedeva
un tempo d'esecuzione almeno cubico rispetto al numero dei possibili
valori assunti dalle ampiezze.
La soluzione finale si basa sulla struttura esplicita della matrice
di co-occorrenza, struttura che si modifica fortemente quando
l'intervallo k fra i campioni di ogni coppia approssima il periodo
del segnale: infatti in questa situazione la matrice approssima
una matrice diagonale. I risultati sono stati più che soddisfacenti
in quanto non solo lo strumento si è rivelato più
veloce di quello iniziale, ma si è dimostrato anche più
robusto e preciso.
Il prototipo è stato realizzato su Macintosh IIcx e Centris
650, in ambiente LabVIEW 2.2 per soddisfare le esigenze di disporre
di una workstation con moduli software facilmente espansibili,
e per rispondere alle proprietà dei punti 1 e 2 citati
sopra. Inoltre in questo modo è possibile usare questo
prototipo in sinergia con Animal House, una applicazione per
lo studio dei sonogrammi realizzata precedentemente al L.I.M.,
sempre in ambiente LabVIEW.
L'ambiente LabVIEW, della National Instruments, dispone di un
linguaggio di programmazione iconico, che consente di costruire
programmi applicativi collegando tra di loro oggetti grafici dal
significato altamente intuitivo. Questa caratteristica dà
la possibilità, anche all'utente finale, di creare i propri
moduli software (magari utilizzandone altri codificati in precedenza)
e di costruirsi così una libreria di strumenti accessibile
in qualsiasi momento.
Inoltre i vari strumenti sono rappresentati sul video con pannelli
che simulano il funzionamento di apparecchiature diagnostiche
e di laboratorio, con la presenza di grafici con cursori e point
marker per misurazioni puntuali, pulsanti, cursori, manopole,
eccetera.
Il prototipo, chiamato significativamente Wailing Lab, è
costituito da:
o un pannello per la calibrazione dei parametri operativi,
o moduli per la segmentazione del segnale in rumore-vagito,
o moduli per il tracciamento del pitch,
o grafici, con possibilità di misurazioni dirette, per
la rappresentazione del segnalesegmentato e del relativo pitch.