Skip to content

Definizione di clusterizzazione non supervisionata

Non esiste una variabile dipendente che guida il processo di apprendimento. Il programma di apprendimento costruisce una struttura di conoscenze utilizzando alcune misure della qualità dei cluster per raggruppare i casi in due o più classi.
Obiettivo primario di una strategia di clusterizzazione non supervisionata è quello di scoprire le strutture concettuali dei dati.
Abbiamo gia visto esempi classici di tale strategia non supervisionata. Vediamo adesso due altre applicazioni.
- VALUTAZIONE APPRENDIMENTO SUPERVISIONATO : un modello di apprendimento supervisionato ha suddiviso il training set in un certo numero di classi. Utilizzare la clusterizzazione non supervisionata per valutare se i casi di ogni classe possono essere raggruppati insieme. Se così non è, possiamo concludere che gli attributi utilizzati nel modello supervisionato non discriminano adeguatamente i casi.
- IDENTIFICAZIONE DEGLI OUTLIER : con un ragionamento analogo al precedente, la clusterizzazione non supervisionata può aiutare ad individuare alcuni casi anomali presenti nei dati (casi non classificabili all’interno di una classe), i cosiddetti outlier.
Gli outlier, normalmente esclusi dalle applicazioni statistiche di data mining, possono rivestire grande importanza.
Ad esempio, un’applicazione che analizza gli acquisti effettuati con carta di credito potrebbe identificare come outlier un caso di probabile uso fraudolento della carta.

Valuta questi appunti:

Continua a leggere:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.