Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Tecniche di localizzazione di una sorgente di suono attraverso l’uso di array di microfoni

Localizzare un suono significa stimare la posizione, all’interno di un ambiente, dalla quale questo è stato generato, cioè la sua sorgente. Questo può comportare l’identificazione della direzione o, a seconda dei casi, anche della distanza.
Questa materia è stata argomento di ricerca fin dagli anni Settanta e da allora una grande varietà di approcci è stata proposta ed investigata. Numerose sono le applicazioni possibili, come ad esempio quelle multimediali e in particolare le teleconferenze, oppure speech recognition (riconoscimento di voce e comandi vocali) e identificazione di un oratore, percezione di suono in ambienti soggetti a rumore o riverbero, registrazioni o conferenze in sale di grandi dimensioni, sorveglianza acustica, localizzazione di corpi sommersi (sonar), dispositivi biomedici di tipo uditivo; ragguardevoli sono anche le potenzialità e gli eventuali campi ai quali queste tecniche possono essere estese. In alcuni casi, ad esempio, si è cercato di integrare le tecniche di localizzazione con quelle di visione, avendo così a disposizione dati forniti da due sensi differenti (sistemi di percezione).
I sistemi che sono stati sviluppati ai fini della localizzazione sono dotati di un array di microfoni, che permette di ottenere risultati non raggiungibili nel caso in cui se ne usi uno solo. Ad esempio è possibile ottenere un segnale ad alta qualità da una particolare locazione, attenuando simultaneamente altre voci o sorgenti di rumore; si parla in questo caso di acquisizione di suono selettiva, per quanto riguarda il punto di vista spaziale. Questo viene poi fatto senza disturbare chi sta parlando, obbligandolo a tenere in mano o a indossare un microfono; inoltre è possibile modificare la direzione di ricezione senza richiedere alcun movimento fisico. Un requisito fondamentale in sistemi di questo tipo è proprio l’abilità di localizzare una sorgente di suono ed eventualmente seguirla nei suoi movimenti (tracking). Allo stesso tempo è possibile considerare uno scenario nel quale le sorgenti di suono sono multiple (multi-speaker) e di conseguenza focalizzare automaticamente su chi sta parlando attualmente.
Proprio in questo ambito, un’applicazione che ultimamente suscita particolare interesse è quella delle video-conferenze, nelle quali si vuole fare in modo di indirizzare le telecamere automaticamente, attivandole attraverso la voce di chi parla e senza dover ricorrere all’utilizzo di alcun operatore umano. Questo tipo di soluzione rappresenta la più naturale possibile e solleva gli utenti da questo incarico, che può essere gravoso o fonte di distrazione.

Questo lavoro è fondamentalmente suddiviso in due parti, la prima delle quali è incentrata sulla descrizione, dal punto di vista teorico, della materia trattata. A tal riguardo sono state descritte le applicazioni di cui la localizzazione è stata fatta oggetto in letteratura e si è parlato, inoltre, dei sistemi di array di microfoni che vengono usati in questo tipo di contesto. Tra tutte le strategie trattate, un particolare occhio di riguardo è stato dato a due di esse, che vengono presentate in maniera più approfondita, discutendone anche il relativo background matematico; queste sono basate, rispettivamente, sulla differenza dei tempi di arrivo, TDOA (Time Difference Of Arrival), e sulla percezione del suono in maniera selettiva nello spazio. Queste tecniche infatti sono considerate di grande importanza, per l’ampio utilizzo che ne è stato fatto e anche per il ruolo fondamentale che hanno rivestito dal punto di vista storico. In particolare, il primo di questi di approcci è stato proprio quello applicato negli esperimenti, dei quali si parla in modo dettagliato nella seconda parte. Ecco un breve sommario dei capitoli:
- Capitolo 1 introduce brevemente il lavoro svolto
- Capitolo 2 espone i principali metodi che sono stati utilizzati per risolvere il problema della localizzazione, partendo da come questo viene affrontato dagli esseri umani.
- Capitolo 3 mostra gli strumenti che sono stati utilizzati e il loro setup durante gli esperimenti. Particolare rilievo ha tra questi l’analizzatore dinamico di segnali, poiché molto tempo è stato dedicato per familiarizzare con esso e testarne il funzionamento.
- Capitolo 4 descrive le prove sperimentali che sono state eseguite all’interno di questo progetto e i risultati ottenuti.
- Capitolo 5 trae le conclusioni relative al lavoro svolto, esponendo risultati e possibili sviluppi futuri.

Mostra/Nascondi contenuto.
Capitolo 1 Introduzione La localizzazione e le relative applicazioni Localizzare un suono signi ca stimare la posizione, all’interno di un ambiente, dalla quale questo e stato generato, cio e la sua sor- gente. Questo pu o comportare l’identi cazione della direzione o, a seconda dei casi, anche della distanza. Questa materia e stata argomento di ricerca n dagli anni Set- tanta e da allora una grande variet a di approcci e stata proposta ed investigata. Numerose sono le applicazioni possibili, come ad esempio quelle multimediali e in particolare le teleconferenze [1], oppure speech recognition (riconoscimento di voce e coman- di vocali) e identi cazione di un oratore, percezione di suono in ambienti soggetti a rumore o riverbero, registrazioni o conferen- ze in sale di grandi dimensioni, sorveglianza acustica, localiz- zazione di corpi sommersi (sonar), dispositivi biomedici di tipo uditivo; ragguardevoli sono anche le potenzialit a e gli eventuali campi ai quali queste tecniche possono essere estese. In alcuni casi, ad esempio, si e cercato di integrare le tecniche di loca- lizzazione con quelle di visione, avendo cos a disposizione dati forniti da due sensi differenti (sistemi di percezione) [2]. 1

Tesi di Laurea

Facoltà: Ingegneria

Autore: Gabriele Salgò Contatta »

Composta da 80 pagine.

 

Questa tesi ha raggiunto 4195 click dal 24/10/2005.

 

Consultata integralmente 7 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.