Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Analisi, Progetto ed Implementazione di un motore di Ricerca di News, con sperimentazione di tecniche di Ranking ed Opinion Mining

In questa tesi, ci siamo occupati dell'ideazione, analisi, progetto, implementazione e sperimentazione di un prototipo completo del motore di ricerca di News "Toc Toc News"; scopo principale del progetto è la sperimentazione di algoritmi proposti nel contesto della recente ricerca scientifica riguardo alle problematiche di assegnazione automatica di uno score di Ranking alle News, così come reperite da uno stream dinamico costantemente aggiornato da un certo numero di sorgenti, sottoscritte per mezzo di canali di feed RSS, in modo da poter visualizzare sulla homePage del motore le News clusterizzate per storia trattata e con un ordine decrescente per il proprio valore di rank; altra problematica principale sperimentata, è relativa a recentissime tecniche di Opinion Mining, che permettano all'utente di visualizzare, assieme alla normale informativa sulla News, anche una etichetta che evidenzi l'eventuale soggettività espressa dal testo della News ed uno score, che ne indichi il maggiore o minor grado, in base alla classificazione tripartita {Positive, Negative, Objective}: qualora il testo di una News, manifesti un orientamento semantico positivo, rispetto al subject di riferimento per essa, l'etichetta associata dall'algoritmo di Opinion Mining sarà, con una certa probabilità di errore, che abbiamo provveduto a minimizzare, Positive, e mostrando in aggiunta uno score indicatore del grado di positività, altrimenti sarà Negative, o Objective, a seconda se manifesti un orientamento inverso, o se si limiti a descrivere un fatto privo di orientamento per il Subject di riferimento.
A livello dell'interfaccia Web, siamo interessati a dare all'utente la potenzialità di scegliere tra una varietà di modalità di ricerca, in base alle proprie esigenze:

1. keywords search:
ricercare per mezzo dell'inserimento di particolari parole chiave, tutte le News che presentano il matching per almeno una di esse, ordinate in base al loro grado di matching, e clusterizzate per storia trattata;

2. phrase search:
ricercare tutte le News che abbiano nel loro titolo, o nella descrizione, o nel loro testo completo, il matching esatto con la frase inserita dall'utente, clusterizzate per storia trattata;

3. subject search:
ricercare tutte le News relative ad un particolare Subject, assieme alla visualizzazione di alcune statistiche sulla soggettività da esso riscontrata su scala temporale, e in base alla differenziazione per singola categoria, ma anche riguardo alla popolarità di quest'ultimo (numero di notizie postate relative al subject di riferimento nell'unità di tempo giornaliera);

4. ranking search:
effettuare la visualizzazione delle Top News ordinate in base al loro valore di Ranking, specificando una categoria di riferimento, e il
numero delle Top News da visualizzare, clusterizzate per storia trattata;

5. source info and Statistics:
visualizzare per una particolare sorgente di News tra quelle sottoscritte, informazioni storiche sulla sorgente, e statistiche sul numero di postings di News che essa effettua per categoria, su scala totale, e su scala giornaliera.

Mostra/Nascondi contenuto.
6 1. Introduzione In questa tesi, ci siamo occupati dell’ideazione, analisi, progetto, implementazione e sperimentazione di un prototipo completo del motore di ricerca di News “Toc Toc News”; scopo principale del progetto è la sperimentazione di algoritmi proposti nel contesto della recente ricerca scientifica riguardo alle problematiche di assegnazione automatica di uno score di Ranking alle News, così come reperite da uno stream dinamico costantemente aggiornato da un certo numero di sorgenti, sottoscritte per mezzo di canali di feed RSS, in modo da poter visualizzare sulla homePage del motore le News clusterizzate per storia trattata e con un ordine decrescente per il proprio valore di rank; altra problematica principale sperimentata, è relativa a recentissime tecniche di Opinion Mining, che permettano all’utente di visualizzare, assieme alla normale informativa sulla News, anche una etichetta che evidenzi l’eventuale soggettività espressa dal testo della News ed uno score, che ne indichi il maggiore o minor grado, in base alla classificazione tripartita {Positive, Negative, Objective}: qualora il testo di una News, manifesti un orientamento semantico positivo, rispetto al subject di riferimento per essa, l’etichetta associata dall’algoritmo di Opinion Mining sarà, con una certa probabilità di errore, che abbiamo provveduto a minimizzare, Positive, e mostrando in aggiunta uno score indicatore del grado di positività, altrimenti sarà Negative, o Objective, a seconda se manifesti un orientamento inverso, o se si limiti a descrivere un fatto privo di orientamento per il Subject di riferimento.

Laurea liv.II (specialistica)

Facoltà: Ingegneria

Autore: Marco Leone Contatta »

Composta da 302 pagine.

 

Questa tesi ha raggiunto 867 click dal 20/06/2013.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.