Strumenti per l'identificazione di strutture
nelle vocalizzazioni infantili

Tesi di laurea di: Franco Ambrosi Matr.: 309105
Relatore: Prof. Goffredo Haus Correlatore: Prof. Mario Italiani
Anno Accademico: 1992/93

 

 

Questa tesi si è svolta presso il Laboratorio di Informatica Musicale del Dipartimento di Scienze dell'Informazione, in collaborazione con alcuni ricercatori del D.S.I., dell'Istituto di Psicologia e dell'Istituto di Neuropsichiatria Infantile della Facoltà di Medicina dell'Università degli Studi di Milano.
Essa nasce dalla necessità di fornire ai ricercatori uno strumento per l'analisi del pianto neonatale in grado di evidenziare i caratteri salienti di questo tipo di segnale, tale da fornire una buona risposta sia relativamente alle caratteristiche individuali che allo stato di salute del neonato.
Il pianto è il segnale acustico di maggior rilevanza biologica nei primi mesi di vita. Finora ne sono stati individuati 80 tipi diversi, quindi è possibile ipotizzare l'esistenza di una quantità discreta di stati emozionali e motivazionali, che si trovino entro un triangolo i cui vertici sono "nascita", "fame", "dolore". In letteratura esistono inoltre delle relazioni accertate fra tipo di patologia (Down, iperbilirubinemia, nascita prematura, assorbimento di sostanze stupefacenti) e il pianto. Si è resa pertanto necessaria la progettazione di uno strumento diagnostico che in quanto tale doveva soddisfare le seguenti proprietà:

1o Interfaccia utente chiara, ordinata e curata anche nell'aspetto.
2o Estrema facilità d'uso e ridotti tempi di training.
3o Buona discriminazione fra i vari tipi di pianto.
4o Velocità, robustezza e precisione.
La ricerca di una soluzione per l'ultimo punto è stata particolarmente lunga e delicata per l'incompatibilità delle proprietà richieste, tenendo conto anche del fatto che le registrazioni in una nursery potevano essere effettuate in condizioni precarie e in presenza di parecchio rumore. Dopo aver passato in rassegna i metodi d'analisi del segnale nel dominio del tempo e delle frequenze, per verificare quale potesse dare maggiori garanzie di discriminazione e robustezza, ho accertato che il parametro più efficace nella rappresentazione del segnale neonatale è l'andamento della frequenza fondamentale delle componenti vocaliche, noto come pitch.
Fra gli strumenti teorici utilizzabili per la ricerca del pitch, si è dimostrato particolarmente robusto quello basato sulle matrici di co-occorrenza, istogrammi bidimensionali di coppie di ampiezze di campioni distanti un certo valore k l'uno dall'altro. Il metodo originale si basava sull'equiparazione del segnale a una serie di pattern statistici, dove la periodicità era cercata testando l'ipotesi di indipendenza statistica delle coppie di ampiezze di campioni e le ampiezze erano viste come possibili valori di due variabili casuali. Il metodo era efficace ma lento, dovendo calcolare molte matrici; inoltre il test d'ipotesi richiedeva un tempo d'esecuzione almeno cubico rispetto al numero dei possibili valori assunti dalle ampiezze.
La soluzione finale si basa sulla struttura esplicita della matrice di co-occorrenza, struttura che si modifica fortemente quando l'intervallo k fra i campioni di ogni coppia approssima il periodo del segnale: infatti in questa situazione la matrice approssima una matrice diagonale. I risultati sono stati più che soddisfacenti in quanto non solo lo strumento si è rivelato più veloce di quello iniziale, ma si è dimostrato anche più robusto e preciso.
Il prototipo è stato realizzato su Macintosh IIcx e Centris 650, in ambiente LabVIEW 2.2 per soddisfare le esigenze di disporre di una workstation con moduli software facilmente espansibili, e per rispondere alle proprietà dei punti 1 e 2 citati sopra. Inoltre in questo modo è possibile usare questo prototipo in sinergia con Animal House, una applicazione per lo studio dei sonogrammi realizzata precedentemente al L.I.M., sempre in ambiente LabVIEW.
L'ambiente LabVIEW, della National Instruments, dispone di un linguaggio di programmazione iconico, che consente di costruire programmi applicativi collegando tra di loro oggetti grafici dal significato altamente intuitivo. Questa caratteristica dà la possibilità, anche all'utente finale, di creare i propri moduli software (magari utilizzandone altri codificati in precedenza) e di costruirsi così una libreria di strumenti accessibile in qualsiasi momento.
Inoltre i vari strumenti sono rappresentati sul video con pannelli che simulano il funzionamento di apparecchiature diagnostiche e di laboratorio, con la presenza di grafici con cursori e point marker per misurazioni puntuali, pulsanti, cursori, manopole, eccetera.
Il prototipo, chiamato significativamente Wailing Lab, è costituito da:
o un pannello per la calibrazione dei parametri operativi,
o moduli per la segmentazione del segnale in rumore-vagito,
o moduli per il tracciamento del pitch,
o grafici, con possibilità di misurazioni dirette, per la rappresentazione del segnalesegmentato e del relativo pitch.