Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Analisi della semantica latente per la consultazione automatica di moduli domanda-risposta

L'anteprima di questa tesi è scaricabile in PDF gratuitamente.
Per scaricare il file PDF è necessario essere iscritto a Tesionline.
L'iscrizione non comporta alcun costo. Mostra/Nascondi contenuto.

tori che ne costituiscono la rappresentazione sub-simbolica [6], in tal modo e`pos- sibile trattare tali entita` indipendentemente dalla loro rappresentazione puramente lessicale e morfologica privilegiandone gli aspetti semantici [7] [8] [9]. Nel presente lavoro viene introdotto un modello vettoriale da applicare al pro- blema del recupero automatico d’informazione basato sull’analisi della semantica latente. A partire da una collezione di documenti, costituita da moduli domanda- risposta (raccolta di FAQ 2 ), applicando la tecnica di scomposizione in valori singo- lari (SVD) [1], [7], [9], e` stata ottenuta una rappresentazione vettoriale semantica dei termini estratti dalla collezione. Nello spazio vettoriale ottenuto il coseno del- l’angolo tra due vettori oltre a misurne la distanza fisica, ne misura quella semantica, piu` i vettori sono vicini piu` i termini che essi rappresentano sono semanticamente legati o perche` hanno significato equivalente o perche` ricorrono negli stessi contesti. Per valutare come l’analisi della semantica latente influisca sulle prestazioni di un sistema di IR si e` utilizzato il modello vettoriale suddetto per implementare varie strategie di ricerca mettendo a confronto i risultati ottenuti. Nei sistemi rea- lizzati si e` cercato di mettere in evidenza gli effetti dell’analisi semantica sia in fase d’indicizzazione 3 , che in fase di recupero dell’informazione. In particolare si e` provveduto alla realizzazione sia di un indice di tipo tradizionale per supportare le operazioni di un motore di ricerca, che di un indice semantico, in cui ad ogni documento della collezione e` stato associato un vettore dello spazio semantico. An- che per le operazioni di ricerca sono stati previsti entrambi gli approcci: recupero semantico tramite confronto vettoriale tra query e documenti, e recupero tramite motore di ricerca. L’impossibilita` a realizzare un sistema di recupero e indicizzazione semantica su larga scala (ricerche nella rete internet) a causa della mole di confronti vetto- riali su cui si basa, ha motivato la realizzazione di moduli semantici che hanno lo scopo di integrare le funzionalita` dei sistemi tradizionali: modulo per l’estensione 2 il termine FAQ (frequently asked questions) indica un particolare tipo di documento, disponi- bile sul web, che contiene una raccolta di domande e relative risposte su un argomento specifico. Solitamente le FAQ sono legate ai gruppi di discussione (news-group, mailing-list). 3 operazione che consente di rappresentare i testi in modo tale da agevolare le operazioni di recupero.

Anteprima della Tesi di Maria Vasile Simone

Anteprima della tesi: Analisi della semantica latente per la consultazione automatica di moduli domanda-risposta, Pagina 2

Tesi di Laurea

Facoltà: Ingegneria

Autore: Maria Vasile Simone Contatta »

Composta da 150 pagine.

 

Questa tesi ha raggiunto 2247 click dal 04/11/2004.

 

Consultata integralmente 4 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.