Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Tecniche per l'estrazione di indici da sorgenti XML

Tecniche per l'estrazione di indici da sorgenti XML

Mostra/Nascondi contenuto.
Introduzione Il continuo incremento di sorgenti di dati strutturati (ad esempio, basi di dati) esemistrutturati disponibili su Web richiede tecniche sempre piu so sticate per acce-dere all'informazione distribuita su piu sorgenti. I tradizionali sistemi per la gestionedi basi di dati hanno, come caratteristica comune, la presenza di uno schema pre-de nito su cui i dati devono essere uniformati. La presenza di uno schema ssoagevola notevolmente il trattamento dell'informazione, in quanto con uno schema siriesce a mettere l'utente a conoscenza della struttura della base di dati (v. Glossa-rio), consentendogli di formulare su di essa interrogazioni signi cative. Nel caso diinformazione semistrutturata, invece, come quelle disponibili via Web, si e in presen-za di una struttura, in generale, troppo irregolare e mutevole per poter catalogarel'informazione secondo dei modelli prede niti.In questo contesto, chiunque intenda accedere ad un documento in rete ha davantiase sostanzialmente il problema di reperirne il contenuto dato che i documenti on-linecontinuano ad aumentare e diventa sempre piu diÆcile trovare le informazioni di realeinteresse. Per far ciovengono in aiuto all'utente i motori di ricerca che si basano sulprincipio delle parole chiavi. Inserendo una o piuparolechiavi si ottiene una lista ditutti i documenti che le contengono, in ordine di rilevanza. L'ordinamento funzionasostanzialmente su base statistica, quindi non e sempre aÆdabile, soprattutto neldettaglio. Il meccanismo delle parole chiave opera infatti con criteri lessicali e nonsemantici ed e in grado di trovare tutti i documenti che contengono una data parola,ma non fornisce alcuna garanzia sul signi cato di quella parola in quel contesto. Eda notare inoltre che trovare un documento solo sulla base delle parole che contienenon e sempre facile. Qualche aiuto puo venire dalle meta informazioni,che peronon sono prese in considerazione da tutti i motori, e per le quali, comunque, nonesiste alcuno standard soddisfacente. Nonostante questi difetti i motori di ricercarimangono uno strumento preziosissimo. Cos come per una casa sicura devonoesserci delle fondamenta robuste, alla base di un motore di ricerca devono esserci degli1

Tesi di Laurea

Facoltà: Ingegneria

Autore: Davide Marangoni Contatta »

Composta da 107 pagine.

 

Questa tesi ha raggiunto 464 click dal 29/11/2006.

 

Consultata integralmente una volta.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.