Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Riconoscimento Di Caratteri Manoscritti Mediante Rete Neurale Addestrata Con Algoritmo Costruttivo Topologico

Un riconoscitore generale di caratteri, che possa essere tanto sofisticato da performare ogni funzione arbitraria, è solo una possibilità teorica. Attualmente i sistemi di riconoscimento possono trattare soltanto limitate e ben definite classi di caratteri.
Un riconoscitore, da un punto di vista puramente teorico, è un apparato che deve performare una serie di operazioni allo scopo di assegnare certi oggetti (patterns) ad una serie data di classi C0, C1, ..., Cm , in accordo con il valore di certe caratteristiche X1, ..., Xn. E' chiaro che gli oggetti, che devono essere riconosciuti, posseggono intrinsecamente dei "valori" individuali X1, ..., Xn, che devono poter essere calcolati o computati in ognuno di essi.
C1, ..., Cm sono le classi di interesse, o classi proprie. In una applicazione di riconoscimento dei caratteri, C1, ..., Cm rappresentano le differenti forme che devono essere discriminate (ciascun carattere o simbolo, normalmente, corrisponde a più di una forma). C0 è una classe speciale, chiamata classe di reject: se un oggetto è classificato come appartenente a C0, significa che il riconoscitore non è riuscito ad assegnarlo esattamente ad una delle classi proprie C1, ..., Cm.
X1, ..., Xn possono essere considerate come coordinate in uno spazio n-dimensionale (spazio delle caratteristiche); e gli oggetti, che devono essere riconosciuti, possono essere rappresentati da punti in questo spazio. In questa ottica, costruire un riconoscitore significa definire gli m sottoinsiemi dello spazio delle caratteristiche (non necessariamente disgiunti) che devono essere utilizzati come regioni di decisione per le proprie classi. Un oggetto è classificato come appartenente ad una propria classe se il suo punto rappresentativo P appartiene solo alla corrispondente regione di decisione. Se P appartiene a più regioni di decisione, o a nessuna, il riconoscitore realizza che non è possibile assegnare all'oggetto la sua propria classe, e allora lo rigetta.
Vari paradigmi del riconoscimento dei caratteri possono essere messi in relazione, dal punto di vista teorico, con le reti neurali.
Consideriamo, di nuovo, il problema di classificazione a M classi (ai, i=1, ..., M) unitamente ad un sistema di classificazione che ripartisca lo spazio dei pattern in M regioni di decisione Ri. La probabilità di corretta classificazione di un pattern x incognito è [20]:
Il classificatore Bayesiano massimizza la probabilità selezionando le regioni che massimizzano l'integrando, cioè assegnando un pattern alla classe ai (ovvero alla regione Ri) tale che p(x|ai)P(ai) sia massima. Per la regola di Bayes, p(x|ai)P(ai) è proporzionale alla probabilità a posteriori p(ai|x) della classe wi dato il pattern x in input.
Poichè è stato dimostrato che reti del tipo Perceptron possono stimare le densità di probabilità di una distribuzione a partire da un insieme finito di esempi [21, 22], un Perceptron può essere una buona approssimazione di un classificatore Bayesiano.
Da un altro punto di vista, si può interpretare l'elaborazione, operata da una rete neurale nella soluzione di un problema di Pattern Recognition, come approssimazione successiva delle ipersuperfici di separazione fra le classi. E' stato dimostrato che due livelli nascosti (hidden) di neuroni sono sufficienti per approssimare qualunque superficie di separazione fra le classi [23].
Inoltre è stato dimostrato [24] che qualunque applicazione continua tra due spazi Euclidei può essere, approssimativamente, realizzata da reti con almeno uno strato hidden e funzioni di trasferimento sigmoidali.
Infine è stato dimostrato che con un solo livello hidden si possono approssimare anche regioni sconnesse [25]
Poichè è impensabile ottenere la soluzione generale esatta del problema di 'discriminazione tra M classi', il quesito viene tradotto in quello di cercare una buona soluzione approssimata. Quindi uno o due strati hidden sono sufficienti per risolvere (in approssimazione) qualunque problema di classificazione.
Per quanto riguarda il numero di nodi della rete, la topologia del problema specifico gioca un ruolo fondamentale. Esistono teorie applicabili alla definizione dei requisiti minimali sulle dimensioni della rete, e sul numero di campioni che essa è in grado di apprendere [26]
Tuttavia, quando si tratta di pattern reali, i risultati possono essere abbastanza sorprendenti: una rete piccola e addestrata su un numero limitato di campioni può fornire (in alcuni casi) buoni risultati di generalizzazione.

Mostra/Nascondi contenuto.
IL RICONOSCIMENTO DEI CARATTERI PREMESSA: Le tecniche di riconoscimento dei caratteri associano una identità simbolica con l'immagine di un carattere. Questo problema, di replicazione a macchina (computers) di funzioni umane, riguarda sia il riconoscimento di caratteri stampati o dattiloscritti, sia il riconoscimento di caratteri manoscritti in corsivo o in stampatello. Il riconoscimento dei caratteri è meglio conosciuto come Optical Character Recognition (OCR- Riconoscimento Ottico dei Caratteri) poichè esso si serve, per il riconoscimento, di caratteri processati otticamente piuttosto che di quelli processati magneticamente [1]. RIFERIMENTI STORICI: Sebbene l'origine del riconoscimento dei caratteri possa farsi risalire fin dal 1870 (esso apparse inizialmente come aiuto per gli handicappati nella vista), e il primo tentativo coronato da successo fu fatto dallo scienziato russo Tyurin nel 1900 [2], la versione veramente moderna dell' OCR appare alla metà degli anni 40 con lo sviluppo dei computers digitali. La motivazione principale per lo sviluppo di sistemi OCR è la necessità di dover tener testa a un'enorme quantità di carta (come assegni bancari, lettere commerciali, registrazioni governative tipo leggi e decreti, giustificativi delle spese fatte con le carte di credito, selezionamento postale automatico), generata dalla espansione della società tecnologica. Le macchine OCR sono state rese disponibili commercialmente dalla metà degli anni 50 e sin da allora si è eseguita una grande ricerca estensiva. Sono stati pubblicati un gran numero di articoli sull'argomento, e anche alcuni libri [3-11]. Pubblicazioni speciali e reports sono ripetutamente apparse nei Proceedings dell'International Joint Conferences on Pattern Recognition e dell'International System, Man and Cybernetics Conferences. Lavori di ricerca appaiono anche in varie altre Conferences come British Conferences on Pattern Recognition e The Scandinavian Conferences on Image Analysis. Vari rapporti sullo stato dell'arte delle ricerche sono stati presentati da Nagy [12], Harmon [13], Stalling [14], Suen et al. [15], Mori et al. [16], Davis and Yall [17] e Chatterji [18]. Attualmente le metodologie di riconoscimento sono molto progredite, rispetto ai primi usi di tecniche primitive per il riconoscimento dei soli numerali stampati a macchina e di un limitato numero di lettere latine, e sono arrivate all'applicazione di tecniche sofisticate per il riconoscimento di una grande varietà di complessi caratteri manoscritti, simboli e ideogrammi includenti anche i caratteri cinesi e giapponesi.

Tesi di Laurea

Facoltà: Ingegneria

Autore: Luigi Brugnolo Contatta »

Composta da 209 pagine.

 

Questa tesi ha raggiunto 3335 click dal 10/02/2005.

 

Consultata integralmente 3 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.