Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Web Usage Mining - Progettazione e sviluppo di un sistema di raggruppamento basato su pattern sequenziali

Per Web mining si intende l'utilizzo delle tecniche di data mining per scoprire ed estrarre informazioni da documentazione, servizi e siti del World Wide Web.
In questa tesi si impiega un algoritmo di Web usage mining per scoprire i percorsi di navigazione più frequenti effettuati da promotori finanziari delle reti gestite da Simgenia SIM S.p.A. durante l'utilizzo del sito dell'azienda. Attraverso la descrizione dei comportamenti di navigazione dei promotori è possibile, ad esempio, modificare il sito per rendere la navigazione più efficace. In generale, con tecniche di Web usage mining si può estrarre della conoscenza su utenti e siti Web non nota a priori.
La tesi introduce i concetti di base e la terminologia usata, che sono il punto di partenza per capire l'argomento di cui si tratta, per poi addentrarsi nello specifico nel Web usage mining e nella applicazione sviluppata. Per rendere l'esposizione del lavoro metodologico e sperimentale più efficace, la tesi tratta il tema del Web Usage Mining nei primi capitoli. In tale ambito di ricerca sono numerose le pubblicazioni che dimostrano come sia effettivamente possibile l'utilizzo dei più avanzati algoritmi di data mining, che sono solitamente usati nei Data Warehouse, anche in ambito Web.
La tesi si pone l'obiettivo di presentare tale argomento ponendo l'accento in primo luogo sulle problematiche ad esso associate e le relative soluzioni presenti in letteratura. Si cercherà, mettendone in luce le potenzialità e i limiti, di dare la misura dell'applicabilità e dell'utilità di tali tecniche, illustrando gli ambiti di sviluppo possibili e mettendole in pratica in un ambito seppur limitato e particolare, come una intranet aziendale.
La tesi vuole mettere in luce, nei diversi stadi di elaborazione dei dati, tutte le problematiche sorte, le soluzioni prese e quelle proposte in letteratura. Inoltre si vogliono fornire suggerimenti e delle linee guida per la progettazione e lo sviluppo futuro di integrazioni e miglioramenti ai tool di mining.
Il lavoro è stato svolto presso SIMGENIA SIM S.P.A. in Stage dall'Agosto 2006 al Febbraio 2007.

Mostra/Nascondi contenuto.
Introduzione Con l'aumentare della quantita dei dati disponibili online, il World Wide Web e diventato un terreno fertile per la ricerca riguardante il data mining. Data la quan- tita e l'eterogeneita dei dati, si e sempre posto il problema di scoprire, estrarre, evidenziare informazioni utili per ni commerciali ed economici (es. E-business, E-commerce), per migliorare la strutture dei siti, per ricavarne statistiche, per la personalizzazione dei siti o per classi care i contenuti e gli utenti web. Il web mining e un settore di ricerca dell'informatica che si occupa di individuare speci che metodologie per l'applicazione delle tecniche di data mining applicate ai dati relativi al World Wide Web. Per questo motivi il web mining e diventato prepotentemente un settore di ricerca dell'informatica molto importante e seguito che si pone come un'area scienti ca multidisciplinare. Esso, infatti, riceve contributi signi cativi derivanti da altre aree di studi, partendo naturalmente dalle scienze statistiche, che servono all'analisi dei dati che si raccolgono, e dalle discipline informatiche che trattano i contenuti web sia dal punto di vista hardware (Web Tecnology) sia dal punto di vista software (ad es. Markup Languages). Discipline quali il data mining e il data warehousing, da sempre interessate alle grandi moli di dati memorizzate nei database, sono fortemente indirizzate ai dati presenti nei server web. Importanti, ovviamente, i contributi dati dall'information retrieval e dall'arti cial intelligence, presenti soprattutto nelle sotto aree riguardanti il machine learning, i linguaggi naturali e gli search engine. Come tutte le aree di studi, il web mining presenta al suo interno diverse sotto aree o tipologie, in particolare dalla letteratura ne vengono de nite tre: il web content mining, il web structure mining e il web usage mining. Ognuna di queste tipologie si occupa di operare il web mining su dei dati web speci ci. Nel caso dei content mining lo studio sara incentrato sui contenuti web, sfruttando i linguaggi strutturati ix

Laurea liv.II (specialistica)

Facoltà: Ingegneria

Autore: Daniele Munarin Contatta »

Composta da 143 pagine.

 

Questa tesi ha raggiunto 1063 click dal 31/07/2007.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.