Skip to content

Punti fondamentali dell'attività di data mining

Il data mining è un’attività di esplorazione e analisi dei dati per individuare, mediante un processo di apprendimento (che è un processo attivo) eventuali regolarità ed estrarre informazioni.
Le regolarità sono rappresentabili sotto forma di modelli, nella forma più svariata. Estrarre informazioni con l’obiettivo di generalizzare tutto ciò che si riferisce a un campione limitato di osservazioni. Si chiamano tecniche induttive o inferenziali perché estendiamo la verità scoperta all’interno di un campione, all’intera popolazione (generalizzazioni).
Informazioni e conoscenza utili nei processi decisionali sotto due aspetti: un aspetto di tipo interpretativo e un aspetto di tipo previsionale.
Le modalità di apprendimento possono essere di tipo supervisionato o non supervisionato. Supervisionato quando esiste la possibilità che un’entità che funge da supervisore verifichi le risultanze del modello di apprendimento e dica quando si è classificato bene. Non supervisionato quando nel data set tutti gli attributi sono equivalenti, a nessuno di loro può essere attribuito il significato di attributo target. In questo caso nessuno dice se il modello di classificazione è corretto.

Valuta questi appunti:

Continua a leggere:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.