Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Un ambiente Java per l'analisi di algoritmi di clustering

In questa tesi si prende in esame l’analisi di algoritmi di clustering in termini di risultati e performance, mediante l’uso di un’applicazione grafica chiamata Ctc sviluppata in Java.
Esistono poche applicazioni che permettono un’analisi semplice e efficace e soprattutto facilmente estendibile. Si tratta per lo più di applicazioni specifiche per la bioinformatica, non facilmente estendibili e che non permettono molta versatilità.
Lo studio dei risultati prodotti da diversi algoritmi di clustering è utile per trovare punti di forza e debolezze in base agli insiemi a cui gli algoritmi vengono applicati. Inoltre permette di testare in maniera operativa gli algoritmi presenti in letteratura.
Nell’arco di questa trattazione verrà mostrato come effettivamente Ctc faciliti l’analisi dei risultati, tramite confronti e calcoli di indici, e come incentivi l’implementazione di algoritmi slegando la visualizzazione dei dati dall’effettivo calcolo del clustering grazie all’architettura a plugin.

Mostra/Nascondi contenuto.
5 1. INTRODUZIONE 1.1 Data mining L'invenzione dei computer prima, e di internet dopo, ha permesso di immagazzinare milioni di informazioni in tutti i campi di studio della vita umana. Oggigiorno ogni azienda, privata o pubblica, basa la sua conoscenza sui dati conservati nei propri archivi elettronici. La carta sta diventando obsoleta. Questa evoluzione ha permesso di velocizzare procedure di ricerca dapprima impensabili, o comunque lunghe e faticose. Basti pensare alla decodifica del genoma umano, consistente in milioni di basi azotate. La raccolta di enormi moli di dati e il facile accesso a queste, è stato solo il primo passo di una nuova concezione di archiviazione. Si sono andate a sviluppare quelle che vengono dette tecniche di data mining. Il data mining ha per oggetto l’estrazione di sapere o di conoscenza a partire da grandi quantità di dati, attraverso metodi automatici o semi- automatici e l’utilizzazione operativa di questa conoscenza. Oggi il data mining è utilizzato per l’estrazione, con tecniche analitiche, di informazioni implicite, intrinseche all’insieme dei dati studiato, per renderle disponibili o direttamente utilizzabili. Rende inoltre possibile l’esplorazione e l’analisi di grandi quantità di dati allo scopo di scoprire schemi significativi.

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Alfredo Nicolosi Contatta »

Composta da 105 pagine.

 

Questa tesi ha raggiunto 677 click dal 04/05/2010.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.