Sintesi di viste da contenuti stereoscopici non calibrati.

Vincenzo Della Corte

Sintesi di viste da contenuti stereoscopici non calibrati.

Scopo della tesi
Il sempre crescente interesse per i contenuti video tridimensionali, in particolare nel campo della distribuzione e fruizione in ambito domestico, ha generato la necessità di progettare nuove ed innovative applicazioni che possano migliorare la qualità dell’esperienza visiva, rendendola sempre più coinvolgente ed immersiva ad una vasta platea di utenti dalle esigenze molto variegate.
Il presente lavoro di tesi, svolta in collaborazione con la STMicroelectronics S.r.l., è rivolto allo studio e realizzazione di una metodologia per la generazione di viste virtuali a partire da contenuti video non calibrati, che può trovare applicazione finale nel campo della 3DTV, in particolare per adattare l'effetto 3D ai moderni TV sia in termini di profondità che di posizionamento relativo al piano del display. Lo stesso algoritmo può altresì essere utilizzato per la realizzazione della cosiddetta “free viewpoint TV”, cioè la possibilità data all’utente di scegliere arbitrariamente il punto di vista da cui godersi la scena, nonché per l’adattamento dei contenuti tridimensionali ricevuti ai formati “multiview” richiesti dai nuovi display 3D autostereoscopici, che non necessitano di occhiali.

Breve descrizione dell’algoritmo implementato
Come anticipato, l' ambito di ricerca nel quale si situa questa tesi in azienda è il 3DTV, cioè la trasmissione, codifica e rendering di video 3D per la televisione del futuro.
L'algoritmo implementato in c++ con il supporto della libreria open source OpenCv 2.2 comprende i seguenti passi:
1. Estrazione delle corrispondenze SIFT1 dalle due immagini in input.
2. Stima della matrice fondamentale tra le due viste tramite il RANSAC2.
3. Minimizzazione su un certo numero di corrispondenze della funzione di riproiezione per la costruzione delle omografie rettificanti delle due immagini.
4. Rettifica delle due immagini ed estrazione delle relative mappe di disparità associate.
5. Costruzione delle camere virtuali sulla traiettoria tra le due camere.
6. Rendering di due sequenze di immagini sulla traiettoria stimata e fusione delle due traiettorie per il riempimento delle occlusioni.
Tale algoritmo riceve in ingresso le due immagini e come parametri di funzionamento vengono fornite 3 soglie:
1. TRESHOLD_SIFT per l' estrazione dei descrittori SIFT.
2. OUTLIERS_TRESHOLD per scartare le corrispondenze che hanno un errore di riproiezione maggiore di tale soglia.
3. DISP_MAX. Massima disparità stimabile sui pixel delle due immagini.
Contributi e risultati
I contributi implementativi da me riportati riguardano:
1. L'estrazione dell' epipolo associato ad una vista.
2. L'estrazione dei valori di parallasse dalle depth map.
3. Il centering delle omografie all'infinito,cioè la rotazione e traslazione dei piani immagine delle due camere.
Le immagini sintetizzate, seppur di buona qualità, presentano errori principalmente dovuti all'estrazione delle corrispondenze SIFT, mappe di disparità stimate e complessità geometrica della scena, criticità che vengono affrontate e discusse nel Capitolo 4. Inoltre l'implementazione in c++ risulta stabile, nel senso che a stessi parametri di ingresso restituisce gli stessi risultati, nonostante l'uso del SIFT e RANSAC che sono algoritmi intrinsecamente non deterministici.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Anteprima Indice Bibliografia

Mostra/Nascondi contenuto.

Capitolo 1 Introduzione In questo lavoro di tesi viene esposto un algoritmo per il rendering di viste virtuali a partire da sole 2 immagini 'non calibrate'. Il rendering constiste nel passare da una scena 3D ad immagini 2D della scena campionando la funzione plenoptica o PF(Appendice A), che viene in qualche modo approssimata con il sensore della fotocamera in qualche punto dello spazio. Tuttavia con la View Synthesis è possibile anche il rendering inverso: partendo dalle immagini della scena ricavare la scena e poi renderizzarla, ma in genere non è necessario ricostruire la scena per ricavare le viste virtuali; questa tecnica è nota come Image Based Rendering. Si cerca quindi di fare un ricampionamento delle viste di partenza secondo una certa funzione di warping. E' impossibile campionare la PF in ogni punto dello spazio poiché servirebbe un sensore sferico in ogni punto della scena[1]. Siccome si fa un campionamento sparso della PF, essendo le immagini di partenza solo 2, il problema del calcolo del parallasse tra pixel corrispondenti viene risolto tramite le 2 mappe di disparità sulle due immagini rettificate ricavate attraverso un algoritmo locale che elabora due mappe di disparità a partire dalle corrispondenze tra aree di colore omogeneo(segmenti) nelle due immagini e, all'interno di ogni segmento, con una metrica SSD, trova le corrispondenze tra i pixel che giacciono sulla corrispondente linea epipolare dell'immagine rettificata. Sintetizzare una vista virtuale significa quindi generare un set di raggi luminosi virtuali che coloreranno il pixel della nuova immagine. La vista virtuale è costruita a meno di un numero numerabile di occlusioni presenti nella scena a seconda della sua complessità geometrica e fotometrica; infatti superfici non visibili in entrambe le immagini di partenza non possono essere codificate nelle mappe di disparità e quindi non possono essere visualizzate nell'immagine virtuale. Invece superfici che sono visibili su una immagine ma non nell'altra sono codificate solo in una depth-map e quindi visibili nella vista virtuale, queste le chiamo occlusioni parziali. Per risolvere le occlusioni sono necessarie delle mappe di disparità a più livelli che sezionano la scena in più strati, oppure usare più viste della stessa[2]. L' IBR offre numerosi vantaggi rispetto ai metodi di rendering usati in Computer Graphics, come il maggiore fotorealismo ed inoltre la complessità del rendering non dipende dal numero dei poligoni 1

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Informazioni tesi

Autore:	Vincenzo Della Corte
Tipo:	Laurea II ciclo (magistrale o specialistica)
Anno:	2010-11
Università:	Politecnico di Torino
Facoltà:	Ingegneria
Corso:	Informatica
Lingua:	Italiano
Num. pagine:	117

Forse potrebbe interessarti la tesi:

La stereoscopia

La visione di immagini tridimensionali e la possibilità di riprodurle ha da sempre affascinato l’uomo. La stereoscopia è una tecnica per la rappresentazione della tridimensionalità a partire da immagini piatte. Il metodo è basato sulla fisiologia degli occhi umani, i quali riescono a riprodurre l’illusione di profondità principalmente perché sono disposti orizzontalmente a qualche centimetro tra loro. Questo...

FAQ

Come consultare una tesi

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni

Perché consultare una tesi?

Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:

perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.

Clausole di consultazione

L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.

Vuoi tradurre questa tesi?

L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

computer vision

stereoscopia

uncalibrated view synthesis

sintesi di viste non calibrate

visione computazionale

virtual trajectory

traiettoria virtuale della camera

depth map

mappa di profondità

virtual camera

camera virtuale

Tesi correlate

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

individua con precisione le parole chiave specifiche della tua ricerca
elimina i termini non significativi (aggettivi, articoli, avverbi...)
se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
utilizza la ricerca avanzata
utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

Leggi la guida

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi

Scopri di più

Sintesi di viste da contenuti stereoscopici non calibrati.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Informazioni tesi

Forse potrebbe interessarti la tesi:

La stereoscopia

FAQ

Come consultare una tesi

Perché consultare una tesi?

Clausole di consultazione

Vuoi tradurre questa tesi?

DUBBI? Contattaci

Parole chiave

Tesi correlate

Non hai trovato quello che cercavi?

Ottimizza la tua ricerca:

Idee per la tesi?

Come si scrive una tesi di laurea?

La tesi l'ho già scritta,ora cosa ne faccio?

Login

La tesi l'ho già scritta,
ora cosa ne faccio?