Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Data mining: algoritmi ed applicazioni

Questa tesi è divisa in due parti ben distinte: una parte introduttiva prevalentemente descrittiva (capitoli 2-3), ed una parte di carattere più innovativo (capitoli 4-6). Più precisamente, il contenuto di questo lavoro è strutturato come segue:
Capitolo 1. Introduzione generale.
Capitolo 2. Introduzione al Data Mining. In questo capitolo si definisce la nozione di Data-Mining, e viene proposta una sintetica ma completa discussione sui principali aspetti e caratteristiche del Data-Mining (perchè è importante, di quali sotto-problemi si compone, quali sono le competenze che richiede, ecc.).
Capitolo 3. Descrizione del metodo PDDP. In questo capitolo il metodo PDDP viene presentato in dettaglio. A conclusione del capitolo vengono brevemente analizzati e discussi i suoi attuali limiti: questa analisi costituirà la premessa e lo stimolo per gli sviluppi dell'algoritmo, che verranno proposti nei capitoli successivi.
Capitolo 4. Definizione dei criteri di valutazione delle performance. In questo capitolo, che si configura come indispensabile premessa ai successivi due capitoli dedicati allo sviluppo del metodo PDDP, si affronta il problema della valutazione delle performance di un algoritmo di unsupervised clustering. Questo problema, ad oggi ancora aperto, viene discusso preliminarmente in modo qualitativo; viene poi data una precisa definizione di un indice di performance (che verrà diffusamente utilizzato nel resto della tesi).
Capitolo 5. Scelta del cluster da partizionare. In questo capitolo si affronterà uno dei principali problemi legati alla tecnica PDDP, ossia la scelta dei sotto-cluster da partizionare (ovviamente al fine di massimizzare la qualità globale della partizione). Verrà proposta e sviluppata una semplice ma innovativa logica di scelta, la cui validità sarà verificata su un insieme di dati sperimentali.
Capitolo 6. Altri problemi. In questo capitolo verranno brevemente affrontati alcuni limiti dell'algoritmo PDDP nella sua attuale formulazione (il problema del trattamento di matrici di elevata dimensionalità, l'aggiornamento dei risultati, il criterio di partizione, ecc.). A questi problemi si darà una proposta di soluzione, che verrà brevemente discussa per via sperimentale o teorica.
Capitolo 7. Conclusioni e sviluppi futuri.

Mostra/Nascondi contenuto.
- 8 - Capitolo 1 Introduzione 1.1. Oggetto ed obiettivi della tesi Argomento di questo lavoro di tesi è il Data-Mining, uno dei temi di ricerca oggi più studiato e più in voga (diciamo pure più “di moda”) nell'ambito della Computer Science e della Matematica Applicata. Contrariamente a quanto il suo (infelice) nome sembrerebbe suggerire, il Data-Mining non consiste nella semplice “query” (o “mining”) di dati in un Data-Base, ma nella ricerca di relazioni complesse, “nascoste” all'interno dell'insieme dei dati disponibili. Trattandosi di relazioni fra numeri (o fra simboli aventi un significato univoco), la loro individuazione e sintesi viene fatta attraverso opportuni modelli matematici; la costruzione di tali modelli è quindi l'obiettivo principale di un algoritmo di Data Mining. L'esplosivo successo del Data-Mining negli ultimi anni è dovuto ad una fortunata combinazione di condizioni, il cui denominatore comune è la pervasività degli strumenti informatici nella gestione aziendale, e l'esponenziale sviluppo di Internet e dei mezzi di comunicazione. Come diretta conseguenza di ciò, oggi è sempre più facile

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Sergio Matteo Savaresi Contatta »

Composta da 88 pagine.

 

Questa tesi ha raggiunto 7569 click dal 20/03/2004.

 

Consultata integralmente 6 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.