Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Metodi per l'auto-orientamento di immagini digitali

Negli ultimi anni la grande diffusione di dispositivi quali fotocamere digitali, cellulari di ultima generazione e scanner ha portato l’utente medio a gestire un numero considerevole di immagini digitalizzate. L’organizzazione, l’archiviazione e la condivisione di questi nuovi album fotografici ha assunto conseguentemente una crescente importanza che ha portato numerosi centri di ricerca a occuparsi di questi temi. La maggior parte dei software progettati allo scopo hanno la necessità di risolvere un problema che risulta vitale per eseguire qualsiasi successiva operazione: stabilire il corretto orientamento dell’immagine digitale, dove con “corretto orientamento” si intende l’orientamento nel quale si è svolta la scena catturata dall’immagine.
Attualmente questo intervento è eseguito manualmente dall’utente; un procedimento apparentemente immediato e poco impegnativo che però diventa gravoso alla luce del gran numero di immagini che sempre più spesso compongono gli album digitali. L’orientamento manuale sta diventando quindi con sempre maggiore frequenza una via sconveniente per affrontare il problema e di pari passo la necessità di un sistema automatico invisibile all’utente ha assunto un valore capitale.
Scopo di questa tesi è appunto l’analisi e la ricerca di un metodo risolutivo efficace per il suddetto problema, considerando raccolte di immagini orientate secondo quattro direttive principali, nello specifico 0°, 90°, 180° e 270°. Il primo passo è consistito in un’analisi rigorosa dei metodi per l’auto-orientamento già esistenti, soffermandosi in particolar modo su quelli più efficienti in termini di percentuale di successo nel riconoscimento del corretto orientamento e per facilità di implementazione. Successivamente è stato messo a punto un nuovo criterio, partendo da uno dei metodi precursori di questa recente area di ricerca, impostato sulle caratteristiche proprie dei momenti colore di un’immagine classificate tramite un framework Bayesiano. Il classificatore, rivelatosi poco efficiente nella fase di sperimentazione, è stato successivamente modificato tramite l’impiego di una Support Vector Machine (SVM) basata su kernel radiale. Il metodo messo a punto è stato poi testato su due grandi set di dati contenenti un’ampia varietà di immagini digitali in termini di composizione (illuminazione notturna o diurna, ecc.), locazione (interni/esterni) e soggetto (persone, edifici, paesaggi, ecc.), per un totale di quasi trentamila campioni, al fine di rilevarne l’accuratezza.
In primo luogo è stata eseguita una panoramica dei metodi attualmente esistenti per l’auto-orientamento delle immagini digitali, con particolare attenzione riservata agli approcci che sono alla base della soluzione proposta. I metodi sono stati affrontati in ordine strettamente cronologico così da evidenziare chiaramente l’evoluzione delle diverse soluzioni nel corso degli anni. Sono analizzati sia metodi che sfruttano segnali percettivi di alto livello e le relazioni semantiche fra le parti dell’immagine, sia i sistemi che utilizzano caratteristiche di basso livello, come quello proposto dalla tesi.
In seguito si è studiato un nuovo approccio all’auto-orientamento creato a partire dalle ricerche precedenti. Si è partiti da una definizione formale del concetto di “momento colore”, per poi analizzare nello specifico la tecnica di vettorizzazione e normalizzazione delle immagini impiegata. È stato poi predisposto un framework Bayesiano, più precisamente un classificatore Linear Vector Quantization (LVQ), pensato e addestrato per una classificazione preliminare. Successivamente è stato progettato un nuovo classificatore SVM che ha sostituito il precedente in virtù della sua maggiore precisione in fase di testing.
Ottenuto un classificatore affidabile si è provveduto a testarlo approfonditamente tramite l’impiego di diversi set di dati. I risultati ottenuti sono stati infine riordinati organicamente per meglio tracciare un quadro generale del criterio risolutivo proposto.
Al termine della ricerca è apparso chiaro come l’orientamento delle immagini digitali sia un’area di ricerca relativamente nuova e, al momento, aperta a più interpretazioni. In assenza di una soluzione univoca e vicina alla perfezione, l’algoritmo proposto ha comunque raggiunto un’accuratezza massima interessante, oscillante fra il 78% e l’82%, in rapporto ai diversi modelli utilizzati per l’addestramento dei modelli di classificatore SVM. Il problema rimane comunque di difficile soluzione a causa dell’enorme varietà di immagini possibili e della necessità di coniugare la precisione dell’algoritmo per l’orientamento a una velocità di esecuzione accettabile. L’approccio più efficiente per future ricerche sul tema si baserà con ogni probabilità su un'integrazione fra classificatori di basso livello, come quello proposto, e classificatori di alto livello preposti al riconoscimento e al conseguente orientamento sulla base di un’analisi semantica.

Mostra/Nascondi contenuto.
INTRODUZIONE Negli ultimi anni la grande diffusione di dispositivi quali fotocamere digitali, cellulari di ultima generazione e scanner ha portato l’utente medio a gestire un numero considerevole di immagini digitalizzate. L’organizzazione, l’archiviazione e la condivisione di questi nuovi album fotografici ha assunto conseguentemente una crescente importanza che ha portato numerosi centri di ricerca a occuparsi di questi temi. La maggior parte dei software progettati allo scopo hanno la necessità di risolvere un problema che risulta vitale per eseguire qualsiasi successiva operazione: stabilire il corretto orientamento dell’immagine digitale, dove con “corretto orientamento” si intende l’orientamento nel quale si è svolta la scena catturata dal dispositivo di acquisizione. Attualmente questo intervento è eseguito manualmente dall’utente; un procedimento apparentemente immediato e poco impegnativo che però diventa gravoso alla luce del gran numero di immagini che sempre più spesso compongono gli album digitali. L’orientamento manuale sta diventando quindi con sempre maggiore frequenza una via sconveniente per affrontare il problema e di pari passo la necessità di un sistema automatico invisibile all’utente ha assunto un valore capitale. Scopo di questa tesi è appunto l’analisi e la ricerca di un metodo risolutivo efficace per il suddetto problema, considerando raccolte di 3

Laurea liv.I

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Matteo Baldi Contatta »

Composta da 44 pagine.

 

Questa tesi ha raggiunto 1013 click dal 17/02/2010.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.