Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Valutazione di strumenti semiautomatici per la creazione di ontologie da risorse testuali

La data di nascita del World Wide Web viene comunemente indicata il 6 agosto 1991, quando Tim Berners-Lee pubblicò il primo sito nella rete Internet, dando vita al fenomeno della tripla W. Nei 15 anni seguenti il Web è cresciuto esponenzialmente ed è diventato uno strumento indispensabile a cui ci rivolgiamo per il lavoro, lo studio, la comunicazione e gli interessi personali. È il più grande deposito di informazioni mai assemblato dall’uomo. Contiene documenti e risorse multimediali riguardanti la quasi totalità di ogni argomento immaginabile, e tutti questi dati sono disponibili “istantaneamente” a chiunque disponga di una connessione a Internet.
Navighiamo, ci informiamo, usiamo, viviamo il World Wide Web attuale come una realtà compiuta senza sapere che nella mente del suo ideatore originale il Web non è stato pensato così come è strutturato oggigiorno.
Infatti il World Wide Web che noi tutti conosciamo è solo una malsana evoluzione dell'idea originale. In realtà, il Web originale era stato pensato per essere un semplice sistema di documentazione ipertestuale, dove ogni informazione fosse contenuta in una pagina e poi relazionata tramite i link secondo un meccanismo semplice, per il quale una pagina descriveva l'informazione contenuta in un altra, mentre un'altra ancora si riferiva ad un altro documento, una ulteriore pagina unificava il concetto di altre tre, e così via. Questo Web originale era molto caotico e poco lineare, ma relazionava le informazioni (identificate univocamente con gli URI). L'evoluzione del Web ha intrapreso un'altra strada, lasciando il compito di riordinare le informazioni sulla logica delle pagine ai vari web master, senza dargli alcun reale significato. Il risultato di questo orientamento è stato che tra il miliardo di pagine del Web di oggi, la possibilità di trovare al primo tentativo l'informazione ricercata spesso è statisticamente nulla.
Ma perché non riusciamo più a ritrovare le informazioni nel mare del Web?
La ragione è molto semplice: usiamo dei programmi per identificare e recuperare tali informazioni, ma le informazioni oggi come oggi, dal punto di vista di quei programmi (i motori di ricerca), non hanno significato, sono tutte uguali, in quanto sono create ad uso e consumo dei soli utenti umani, gli unici allo stato attuale in grado di comprendere i contenuti delle pagine che stanno visitando.
La soluzione: un Web nel quale agiscano agenti intelligenti, applicazioni in grado di comprendere il significato dei testi presenti sulla rete e perciò di guidare l'utente direttamente verso l'informazione desiderata, oppure di sostituirsi a lui nello svolgimento di alcune operazioni.
Il termine Web Semantico è stato coniato da Tim Berners-Lee nel 2001 per identificare un web strutturato in maniera tale da essere comprensibile alle macchine. L'idea è quella di utilizzare schemi per descrivere domini di informazione. Un dominio deve essere descritto da un particolare schema. Dei meta dati devono mappare i dati rispetto a classi, o concetti, di questo schema di dominio. In questo modo posso disporre di strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati.
Riassumendo il Web Semantico deve comporsi di tre livelli fondamentali. Al livello più basso abbiamo i dati, i meta dati riportano questi dati ai concetti di uno schema, l'ontologia, nella quale si esprimono le relazioni fra concetti, che diventano classi di dati.
Questo lavoro intende dare uno spaccato sul tirocinio svolto presso l'Intellisemantic srl Riguardo al Web Semantico e in particolare riguardo alle ontologie e ai programmi attualmente esistenti per la creazione semiautomatica di quest'ultime a partire da documenti di testo.
Le ontologie, termine preso in prestito dal linguaggio filosofico, sono uno strumento essenziale della nuova rete ma, come vedremo, crearle non è semplice. Occorre una buona conoscenza del dominio in cui si opera e spesso la vastità dei dati di partenza rende il lavoro alquanto complicato.
In molti laboratori di ricerca ci si è messi all'opera per realizzare dei programmi che svolgano per noi il compito. L'indagine svolta ha evidenziato che ad oggi non esiste un programma in grado di costruire in maniera semiautomatica delle ontologie di qualità elevata. Tuttavia ne sono stati analizzati alcuni di notevole interesse che rappresentano un buon punto di partenza nella creazione delle ontologie e fanno ben sperare riguardo a futuri miglioramenti.

Mostra/Nascondi contenuto.
                                                        !   "            #        $      #                                     $          % &     $       '   (                        )                  *   + ,         !,                  )  $   ,              #     -  #            ,      #    $    .     )                   $         $          $   /               . $           .                          -  0                    $   $ 1        234  .  $    ,  .           $      5   $                #  ,              )            . $        #      6  ,7   &    $     8   #     9              $       $                      1    4 ,                                     ,     $  9          $                          .          . $                           $          #                :;;       5            , 

Laurea liv.I

Facoltà: Ingegneria

Autore: Sara Valente Contatta »

Composta da 51 pagine.

 

Questa tesi ha raggiunto 1140 click dal 01/04/2008.

 

Consultata integralmente 2 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.