Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Tool perl la valutazione della degradazione della qualità dei dati negli algoritmi di anonimizzazione delle basi di dati

Lo scopo del lavoro è finalizzato ad analizzare la qualità dei dati in database sicurizzati. Si vuole ottenere una base di dati manipolata in modo da non violare la data privacy. A tal fine è stata utilizzata la tecnica della generalizzazione. Tale tecnica provvede a sostituire gli attributi sensibili con altri meno specifici, ma semanticamente consistenti ( si pensi, ad esempio, la sostituzione della data di nascita con il solo anno di nascita). A seconda dello stato del database e dei requisiti di riservatezza tale sostituzione avviene con dati sempre più generici. L’operazione comporta, senz’altro, una perdita della qualità dell’informazione. Per qualità dell’informazione si intende, la quantità di informazione che è possibile estrarre dalla base di dati così anonimizzata.
Sono state definite delle metriche atte a descrivere il rapporto tra qualità di dati e data privacy; infatti, lo scopo del lavoro, è analizzare in che modo degradano i dati all’aumentare della riservatezza:
- può variare il numero di tuple ottenute dalla stessa interrogazione alle due basi di dati (distinguiamo, inoltre, il numero di tuple ottenute dalle selezioni, con il numero di tuple ottenute da interrogazion ad attributi numerici).
- è necessario conoscere se il database sia vulnerabile (per vulnerabilità si intende la possibilità di ottenere dati sensibili da un attacco mirato alla base di dati) , anche dopo l’anonimizzazione. A tal fine è stata definita una metrica che indichi la percentuale di tuple esposte a vulnerabilità.
- si è definita una metrica per misurare la perdita di informazione ottenuta.
- si utilizza un ulteriore indice che indica l’utilità dell’anonimizzazione, vista come rapporto tra la quantità di informazione ricevuta dai database anonimo e originario.
Il passo successivo è stata l’implementazione di un tool che fosse in grado di connettersi ad un database, anonimizzarlo, e misurare i parametri appena definiti.
La creazione del tool è stata seguita dalla fase di sperimentazione. Quindi è stata creata una base di dati contenente dati personali, nella fattispecie dati medici; il database è stato successivamente anonimizzato su 4 livelli differenti. E’ stato definito un set di 100 interrogazioni e si è proceduto a sottometterle alle 5 istanze della base di dati.
I dati registrati hanno permesso di effettuare un’analisi descrittiva ed un’analisi statistica dei risultati, definendo, così, le dinamiche di degradazione dei dati negli algoritmi di anonimizzazione.

Mostra/Nascondi contenuto.
Introduzione Michele Buffolino - Tool per la valutazione della degradazione della qualit dei dati negli algoritmi di anonimizzazione delle basi di dati. I Introduzione La protezione dei dati sta divenendo una topica caratterizzante le tecnolgie dell informazione. Il problema Ł fortemente centrale nella disciplina di basi di dati, ove esiste, infatti, la necessit di proteggere grandi volumi di dati raccolti da societ private ed enti statali. Un database Ł una raccolta di dati ed un insieme di regole che organizzano i dati mediante relazioni tra di essi. Un DataBase Management System (DBMS) gestisce il ciclo di vita dei dati, a partire dalla loro archiviazione fino alle attivit di manutenzione; tipicamente questi sistemi presentano architetture di tipo client server tali che i dati sono preservati in una posizione centrale e la fruizione dei dati possa avvenire in base alle singole necessit . Un database offre molti vantaggi rispetto ad un file system semplificato, in quanto molti utenti hanno la possibilit di utilizzare un sistema comune e centralizzato che gode delle seguenti propriet : • Ł garantita la minima ridondanza dei dati. • esiste un controllo sulla coerenza dei dati, per cui una modifica ad un determinato valore produce effetti anche sui valori che vi dipendono in modo diretto o indiretto. • la base di dati garantisce l integrit delle informazioni conservate proteggendoli da modifiche accidentali e nocive.

Laurea liv.I

Facoltà: Ingegneria

Autore: Michele Buffolino Contatta »

Composta da 144 pagine.

 

Questa tesi ha raggiunto 1003 click dal 16/01/2007.

 

Consultata integralmente 2 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.