Sviluppo di una rete neurale convoluzionale per la ricostruzione Multi View Stereo 3D
Visione Artificiale
Uno dei campi d’impiego di maggior successo delle tecniche percettive e delle reti neurali è quello della visione artificiale.
La visione artificiale ha come scopo principale quello di riprodurre il comportamento dell’occhio umano o animale. Oggi molti sistemi necessitano di avere meccanismi di visione artificiale, tra questi si possono citare: robot, pilota automatico, armi intelligenti etc.
L’area della visione artificiale sta avanzando rapidamente grazie ad deep learning, in quanto, sperimentalmente, è stato rilevato il buon funzionamento di tale tecnica. Tuttavia, le attuali conoscenze non permettono di spiegarne le procedure di funzionamento, quindi permangono problemi di computer vision ancora molto complessi da risolvere. Tra i più comuni si possono citare:
• la classificazione di un’immagine, ad esempio individuare quale animale è raffigurato nell’immagine;
• riconoscimento facciale, cioè estrarre dall’immagine delle informazioni che permettano di identificare l’individuo raffigurato nell’immagine stessa;
• stima della profondità dei pixel di un’immagine 2D;
Nella computer vision, in tanti casi, l’input può essere molto grande. Ad esempio, se abbiamo un’immagine catturata con una fotocamera ad 1 Megapixel, avremo una dimensione pari a 1000x1000x3, cioè 3 milioni di pixel.
Avere 3 milioni di parametri di input è purtroppo un problema per le prestazioni, poiché una rete neurale standard avrebbe, per gli strumenti hardware disponibili attualmente, troppi parametri da dover gestire e aggiornare durante l’allenamento, per questo motivo spesso vengono utilizzate le reti convoluzionali.
Convoluzione e riconoscimento dei contorni
L’operazione di convoluzione è uno dei blocchi fondamentali per creare una rete convoluzionale.
Una convoluzione si può riassumere come una semplice moltiplicazione matriciale in cui la prima matrice è rappresentata dall’immagine e la seconda è quella che viene chiamato filtro convoluzionale.
Durante l’allenamento di una rete convoluzionale avviene che, nei primi livelli, essa impara a riconoscere le caratteristiche di base di un’immagine, ad esempio il riconoscimento dei contorni, e che, ad allenamento inoltrato, riesce a riconoscere caratteristiche sempre più complesse dell’immagine.
In Figura 18 è riportato un esempio di immagine in scala di grigi con un contorno verticale centrale (cambio di colore). A questa immagine viene applicato un operatore filtro (kernel) convoluzionale, il quale assume la funzione di rilevare la posizione del contorno verticale.
Per eseguire la convoluzione e calcolare gli elementi della nuova matrice si moltiplicherà, elemento per elemento, il filtro per la parte superiore sinistra della matrice, poi si eseguirà la somma e successivamente il filtro verrà fatto scorrere di una posizione, quindi si eseguirà la convoluzione. Si continuerà in questo modo fino a quando non sarà scandita tutta l’immagine(matrice) di input.
Padding e Stride
Eseguita la convoluzione, come si può notare dalla Figura 18, succede che l’output diventa più piccolo dell’immagine originale. Questo potrebbe portare ad avere dei problemi se si vuole avere un output di dimensione uguale a quello originale.
Per evitare che questo accada, si può utilizzare il padding, cioè si può aggiungere un contorno all’immagine con il valore 0.
In questo modo si otterrà un’immagine di dimensione uguale a quella originale.
Un altro parametro della convoluzione si chiama stride (passo) e indica, invece, di quanto viene traslato il filtro ad ogni passo. In Figura 18, ad esempio, è stato utilizzato uno stride uguale ad 1.
Reti neurali residuali
Le reti neurali profonde sono difficili da allenare, a causa dei problemi di scomparsa ed esplosione del gradiente dunque vengono modificate spesso per risolvere gli inconvenienti riscontrati. Una delle tecniche cui si può ricorrere è quella che ne modifica l’architettura rendendo la rete residuale.
Con le reti neurali residuali si utilizzano i parametri di attivazione di un layer per alimentare un layer successivo. In Figura 19 è riportato un esempio di blocco residuale, dove l’output del layer “l-2” viene utilizzato come input del layer “l”.
Usando i blocchi residuali è possibile allenare delle reti neurali più profonde. Infatti, se si utilizzano reti neurali convoluzionali standard, aggiungendo sempre più livelli alla rete, aumenta gradatamente l’errore di training, invece con le reti neurali residuali simili errori non si generano.
L’idea che sta alla base di questa tipologia di reti è stata impiegata nel presente lavoro per sviluppare la rete MVS-PydNet.
Questo brano è tratto dalla tesi:
Sviluppo di una rete neurale convoluzionale per la ricostruzione Multi View Stereo 3D
CONSULTA INTEGRALMENTE QUESTA TESI
La consultazione è esclusivamente in formato digitale .PDF
Acquista
Informazioni tesi
Autore: | Alessandro Pagliaro |
Tipo: | Laurea II ciclo (magistrale o specialistica) |
Anno: | 2021-22 |
Università: | Università degli Studi di Bologna |
Facoltà: | Ingegneria |
Corso: | Informatica |
Relatore: | Matteo Poggi |
Lingua: | Italiano |
Num. pagine: | 117 |
FAQ
Come consultare una tesi
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Perché consultare una tesi?
- perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
- perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
- perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
Clausole di consultazione
- L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
- Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
- L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
Vuoi tradurre questa tesi?
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »
DUBBI? Contattaci
Contatta la redazione a
[email protected]
Parole chiave
Tesi correlate
Non hai trovato quello che cercavi?
Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database
Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione
Ottimizza la tua ricerca:
- individua con precisione le parole chiave specifiche della tua ricerca
- elimina i termini non significativi (aggettivi, articoli, avverbi...)
- se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
- utilizza la ricerca avanzata
- utilizza gli operatori booleani (and, or, "")
Idee per la tesi?
Scopri le migliori tesi scelte da noi sugli argomenti recenti
Come si scrive una tesi di laurea?
A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?
Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.
La tesi l'ho già scritta,
ora cosa ne faccio?
La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.
Il nostro consiglio è di non sprecare tutto questo lavoro:
È ora di pubblicare la tesi