Skip to content

Progettazione e Implementazione di un sistema per la costruzione automatica di sommari a partire da pagine Web

Motore di ricerca

Il motore di ricerca fa parte del modulo di Retrieval, in quanto con il termine motore di ricerca si racchiudono tutti i moduli di ricerca dal web.
Dovendo inoltre dare una definizione generale del motore di ricerca possiamo dire che:
Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da lui stesso raccolti e restituisce un indice dei contenuti disponibili classificandoli in base a formule matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca.
Quello che è stato fatto in questo progetto non si allontana dalla definizione che è stata data, in quanto l'utente può, tramite una parola chiave, ricercare i link che contengono quella parola e il web restituisce tutti i link che contengono tale parola ordinati a seconda della rilevanza della parola chiave di ricerca.
Ovviamente non è stata rinventata la ruota ma è stato utilizzato e adattato uno fra i tanti strumenti già esistenti sul mercato, API di Google.
Le Api di Google sono una libreria che permette di avere in Java un motore di ricerca per diverse tipologie di file, e sono open source. E' una libreria estremamente flessibile che ci permette di inserire nelle nostre applicazioni le funzionalità di motore di ricerca.
In realtà questa libreria è un vero e proprio motore di ricerca che noi richiamiamo dicendogli "Mi cerchi questa cosa?" e lui fa tutto in automatico.
La gerarchia delle nostre informazione parte dall'"INDEX", ovvero dall'indice. In questo sono presenti diversi "DOCUMENTS",che rappresentano i vari documenti che sono stati indicizzati. Per ogni documento avremo diversi "FIELD", ovvero una coppia di nome/valore che identifica un'informazione sul nostro documento. Nel momento in cui noi dobbiamo creare un indice chiameremo una classe, che ci permette appunto di aggiungere tutti i Documents al nostro indice. Il Document stesso deve essere creato da noi, inserendo al suo interno i diversi Field che lo descrivono.
Quando dobbiamo effettuare una ricerca ci dobbiamo basare sul QueryParser, che è la classe generatrice delle nostre Query. Come risultato di una query avremo un vettore di Documents, che soddisfano i requisiti della nostra ricerca.
Il Motore di ricerca personalizzato è composto dalla specifica XML del motore e da una serie di annotazioni. Per creare il Motore di ricerca personalizzato, è possibile utilizzare la procedura guidata, se si preferisce non dipendere strettamente dal linguaggio XML. Tuttavia, alcune funzioni sono ancora disponibili attraverso l'interfaccia basata su moduli. Per accedere a queste funzioni, bisogna creare le specifiche del proprio motore di ricerca personalizzato utilizzando il linguaggio XML.
In modo analogo, si può aggiungere, uno alla volta, siti o pattern URL nel Motore di ricerca personalizzato utilizzando il pannello di controllo del Motore di ricerca personalizzato o il Marcatore Google. Se si desidera aggiungere in una sola volta un gran numero di siti web al motore di ricerca, vi è anche la possibilità di caricare i file con un elenco di annotazioni utilizzando uno dei formati file descritti in questo documento.
Un altro motivo per caricare le annotazioni in uno di questi formati file consiste nella possibilità di associare punteggi ai pattern URL, una funzione attualmente non disponibile nel pannello di controllo o nel Marcatore Google. Questi punteggi possono essere utilizzati per controllare il posizionamento dei risultati di ricerca.

Questo brano è tratto dalla tesi:

Progettazione e Implementazione di un sistema per la costruzione automatica di sommari a partire da pagine Web

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Informazioni tesi

  Autore: Lorenzo Carullo
  Tipo: Laurea I ciclo (triennale)
  Anno: 2007-08
  Università: Università degli Studi di Napoli - Federico II
  Facoltà: Ingegneria
  Corso: Ingegneria dell'informazione
  Relatore: Antonio Picariello
  Lingua: Italiano
  Num. pagine: 94

FAQ

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

web
summarization
algoritmo di sommarizzazione

Tesi correlate


Non hai trovato quello che cercavi?


Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti


Come si scrive una tesi di laurea?


A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.


La tesi l'ho già scritta,
ora cosa ne faccio?


La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi