Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Sistema di classificazione e recupero dei documenti basato sul linguaggio naturale

L'anteprima di questa tesi è scaricabile in PDF gratuitamente.
Per scaricare il file PDF è necessario essere iscritto a Tesionline.
L'iscrizione non comporta alcun costo. Mostra/Nascondi contenuto.

Capitolo 1: Introduzione 3 in modo efficiente, con conseguente spreco di risorse e spesso anche con duplicazione delle informazioni stesse. Al fine di fornire una soluzione a tali problemi sono stati fatti molti tentativi nei due filoni di ricerca relativi e precisamente del Text Classification (TC) e dell�Information Retrieval (IR). La Classificazione di Testi (TC) � il processo che consente di associare testi in linguaggio naturale ad una categoria tematica scelta tra un insieme di categorie predeterminato. Se l�operazione di classificazione � gestita interamente dal sistema senza l�interazione con l�utente, la classificazione si dice automatica 1 . Il processo di classificazione (TC) � usato in pi� contesti. Ad esempio: l�indicizzazione automatica dei documenti al fine del loro recupero efficiente, la disambiguazione di termini, il filtraggio di documenti e in generale in tutte le applicazioni in cui � richiesta un�organizzazione tematica dei documenti. Il recupero delle informazioni (IR) �� il processo coinvolto nella rappresentazione, nella memorizzazione, nella ricerca e nel recupero di informazioni rilevanti rispetto ad una richiesta di informazioni effettuata da un utente� [P. Ingwersen et al. �95]. L�obiettivo dei sistemi di IR � �condurre l�utente a quei documenti che meglio soddisfano la sua richiesta di informazioni� [Belking et al. �92]. In passato i sistemi per il recupero di informazioni erano incentrati su basi di dati bibliografiche ed erano basati su approcci booleani, cio� veniva verificato se la parola desiderata fosse contenuta o meno nell�insieme dei documenti esistenti. Oggi tuttavia la situazione � sicuramente progredita. Le tecniche di recupero (retrieval) basate su IR sono adottate nella maggior parte dei servizi che coinvolgono la ricerca di informazioni, a partire da Internet stesso (vedi per esempio Lycos, infoseek). Molte delle caratteristiche che erano considerate troppo 1 In seguito ogni qual volta � specificato il termine �classificazione� si intende: classificazione automatica

Anteprima della Tesi di Debora Desideri

Anteprima della tesi: Sistema di classificazione e recupero dei documenti basato sul linguaggio naturale, Pagina 2

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Debora Desideri Contatta »

Composta da 207 pagine.

 

Questa tesi ha raggiunto 1656 click dal 20/03/2004.

 

Consultata integralmente 3 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.