Sviluppo di una rete neurale convoluzionale per la ricostruzione Multi View Stereo 3D

Visione Artificiale

Uno dei campi d’impiego di maggior successo delle tecniche percettive e delle reti neurali è quello della visione artificiale.
La visione artificiale ha come scopo principale quello di riprodurre il comportamento dell’occhio umano o animale. Oggi molti sistemi necessitano di avere meccanismi di visione artificiale, tra questi si possono citare: robot, pilota automatico, armi intelligenti etc.
L’area della visione artificiale sta avanzando rapidamente grazie ad deep learning, in quanto, sperimentalmente, è stato rilevato il buon funzionamento di tale tecnica. Tuttavia, le attuali conoscenze non permettono di spiegarne le procedure di funzionamento, quindi permangono problemi di computer vision ancora molto complessi da risolvere. Tra i più comuni si possono citare:
• la classificazione di un’immagine, ad esempio individuare quale animale è raffigurato nell’immagine;
• riconoscimento facciale, cioè estrarre dall’immagine delle informazioni che permettano di identificare l’individuo raffigurato nell’immagine stessa;
• stima della profondità dei pixel di un’immagine 2D;
Nella computer vision, in tanti casi, l’input può essere molto grande. Ad esempio, se abbiamo un’immagine catturata con una fotocamera ad 1 Megapixel, avremo una dimensione pari a 1000x1000x3, cioè 3 milioni di pixel.
Avere 3 milioni di parametri di input è purtroppo un problema per le prestazioni, poiché una rete neurale standard avrebbe, per gli strumenti hardware disponibili attualmente, troppi parametri da dover gestire e aggiornare durante l’allenamento, per questo motivo spesso vengono utilizzate le reti convoluzionali.

Convoluzione e riconoscimento dei contorni
L’operazione di convoluzione è uno dei blocchi fondamentali per creare una rete convoluzionale.
Una convoluzione si può riassumere come una semplice moltiplicazione matriciale in cui la prima matrice è rappresentata dall’immagine e la seconda è quella che viene chiamato filtro convoluzionale.
Durante l’allenamento di una rete convoluzionale avviene che, nei primi livelli, essa impara a riconoscere le caratteristiche di base di un’immagine, ad esempio il riconoscimento dei contorni, e che, ad allenamento inoltrato, riesce a riconoscere caratteristiche sempre più complesse dell’immagine.
In Figura 18 è riportato un esempio di immagine in scala di grigi con un contorno verticale centrale (cambio di colore). A questa immagine viene applicato un operatore filtro (kernel) convoluzionale, il quale assume la funzione di rilevare la posizione del contorno verticale.
Per eseguire la convoluzione e calcolare gli elementi della nuova matrice si moltiplicherà, elemento per elemento, il filtro per la parte superiore sinistra della matrice, poi si eseguirà la somma e successivamente il filtro verrà fatto scorrere di una posizione, quindi si eseguirà la convoluzione. Si continuerà in questo modo fino a quando non sarà scandita tutta l’immagine(matrice) di input.

Padding e Stride
Eseguita la convoluzione, come si può notare dalla Figura 18, succede che l’output diventa più piccolo dell’immagine originale. Questo potrebbe portare ad avere dei problemi se si vuole avere un output di dimensione uguale a quello originale.
Per evitare che questo accada, si può utilizzare il padding, cioè si può aggiungere un contorno all’immagine con il valore 0.
In questo modo si otterrà un’immagine di dimensione uguale a quella originale.
Un altro parametro della convoluzione si chiama stride (passo) e indica, invece, di quanto viene traslato il filtro ad ogni passo. In Figura 18, ad esempio, è stato utilizzato uno stride uguale ad 1.

Reti neurali residuali
Le reti neurali profonde sono difficili da allenare, a causa dei problemi di scomparsa ed esplosione del gradiente dunque vengono modificate spesso per risolvere gli inconvenienti riscontrati. Una delle tecniche cui si può ricorrere è quella che ne modifica l’architettura rendendo la rete residuale.
Con le reti neurali residuali si utilizzano i parametri di attivazione di un layer per alimentare un layer successivo. In Figura 19 è riportato un esempio di blocco residuale, dove l’output del layer “l-2” viene utilizzato come input del layer “l”.
Usando i blocchi residuali è possibile allenare delle reti neurali più profonde. Infatti, se si utilizzano reti neurali convoluzionali standard, aggiungendo sempre più livelli alla rete, aumenta gradatamente l’errore di training, invece con le reti neurali residuali simili errori non si generano.
L’idea che sta alla base di questa tipologia di reti è stata impiegata nel presente lavoro per sviluppare la rete MVS-PydNet.

Questo brano è tratto dalla tesi:

Sviluppo di una rete neurale convoluzionale per la ricostruzione Multi View Stereo 3D

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Informazioni tesi

Autore:	Alessandro Pagliaro
Tipo:	Laurea II ciclo (magistrale o specialistica)
Anno:	2021-22
Università:	Università degli Studi di Bologna
Facoltà:	Ingegneria
Corso:	Informatica
Relatore:	Matteo Poggi
Lingua:	Italiano
Num. pagine:	117

FAQ

Come consultare una tesi

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni

Perché consultare una tesi?

Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:

perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.

Clausole di consultazione

L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.

Vuoi tradurre questa tesi?

L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

reti neurali

intelligenza artificiale

convoluzione

visione artificiale

ricostruzione 3d

multi view stereo

depth estimation

mvs-net

pydnet

Tesi correlate

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

individua con precisione le parole chiave specifiche della tua ricerca
elimina i termini non significativi (aggettivi, articoli, avverbi...)
se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
utilizza la ricerca avanzata
utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

Leggi la guida

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi

Scopri di più

Chi siamo

Contattaci

Sviluppo di una rete neurale convoluzionale per la ricostruzione Multi View Stereo 3D

Visione Artificiale

Questo brano è tratto dalla tesi: