Skip to content

Qualità dei dati in ingresso: dati inconsistenti

I dati presentano talvolta discrepanze nella codifica di rappresentazione e risultano quindi inconsistenti. L’inconsistenza del dato è determinata da un cambiamento nelle modalità di rappresentazione.
Ad esempio, la codifica dei prodotti realizzati da un’azienda può aver subito una revisione a partire da una certa data, senza che i dati registrati in periodi precedenti siano stati oggetto di trasformazione.
E’ evidente che per ovviare a questo problema il dataset dovrà essere opportunamente trattato prima di essere utilizzato per le analisi di data mining.
Devo andare a capire cosa è avvenuto all’interno dei sistemi primari e procedere a una ricodifica.
Valuta questi appunti:

Continua a leggere:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.