Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Dipendenze Funzionali Temporali Approssimate basate su Grouping Temporali: modellazione, derivazione e prime valutazioni su dati psichiatrici

Le moderne tecnologie permettono acquisizioni e elaborazioni di informazione in quantità inedite. Una sfida che accomuna tutte le organizzazioni è quella di gestire l’overload informativo che ne deriva, trasformando i molti dati a disposizione in informazioni utili all’attività decisionale.
Ben consolidate sono le metodologie che si occupano di estrarre informazione dai dati e che rientrano nella disciplina del Data mining.
Un filone ancora poco esplorato è il Data mining temporale, che cerca di introdurre il tempo nelle analisi classiche di mining.

Un medico potrebbe chiedersi: “ci sono periodi dell’anno nei quali le assistenze telefoniche offerte per una particolare patologia richiedono sempre un certo numero di personale coinvolto?”, oppure il manager di un’azienda di logistica può essere interessato a rispondere alla domanda: “considerando un particolare articolo merceologico, c'è una relazione tra gli ordini effettuati a distanza di meno di 15 giorni e la quantità richiesta?”. Per elaborare le risposte a questo tipo di domande serve uno strumento con il quale esprimere associazioni esatte o approssimate tra i concetti (o attributi) coinvolti; ad esempio, il fatto che la particolare patologia richieda sempre un certo numero di personale coinvolto sarà espresso tramite una Dipendenza Funzionale (FD) tra l’attributo patologia e l’attributo personale; mentre, se il fatto venisse riformulato in “la particolare patologia solitamente richiede un certo numero di personale coinvolto” parleremo di Dipendenza Funzionale Approssimata (AFD) ammettendo così delle eccezioni alla regola FD. Tuttavia, questi strumenti non sono abbastanza potenti per esprimere le domande formulate dal medico e dal manager poichè non considerano un altro aspetto coinvolto: il tempo. Le associazioni tra gli attributi infatti vanno valutate in particolari intervalli temporali (ad esempio mese per mese, anno per anno, nei 15 giorni successivi).

Il lavoro di tesi si propone di definire ed estrarre dai dati nuove regole di associazione chiamate Dipendenze Funzionali Temporali Approssimate (ATFD) che legano i tre aspetti appena considerati: la dipendenza tra gli attributi, l’approssimazione e il tempo.
Dopo aver inquadrato formalmente il problema, vengono proposte soluzioni algoritmiche arrivando ad un sistema di estrazione applicabile a data set reali e facilmente integrabile con il sistema informativo esistente.

Mostra/Nascondi contenuto.
Capitolo 1 Fondamenti A partire dagli anni novanta, e sorta l’esigenza di utilizzare la grande mole di dati prodotta dai sistemi informativi esistenti e di metterla al servizio dei processi decisionali e direzionali dell’organizzazione. Sono nati cos i sistemi Data Warehouse (DW) [13] e i sistemi di Knowledge Discovery in Databases (KDD) [11]. I due approcci rispondono a esigenze diverse: i sistemi DW si preoccupano di raccogliere, uniformare e sintetizzare l’informazione prove- niente da sorgenti operazionali eterogenee orendo un servizio orientato al- l’utente. I processi di KDD, invece, si preoccupano di estrarre informazione non esplicitamente memorizzata, tentando di generare nuova informazione potenzialmente utile e comprensibile utilizzando sosticati algoritmi di Data Mining. 1.1 I sistemi di Data Warehouse I sistemi di Data Warehouse supportano quella parte del sistema informativo che si occupa delle attivit a direzionali e di customer relationship manage- ment. Tali sistemi aiutano i proli manageriali nella denizione di politiche strategiche e tattiche, presentando l’informazione necessaria in modo agevole e aggiornato. I nuovi requisiti rispetto ai sistemi operazionali, detti anche sistemi On Line Transaction Processing (OLTP), portano all’introduzione della tecnolo- gia On Line Analytical Processing (OLAP), termine introdotto da Edgard F. Codd [7]. I sistemi OLAP forniscono una visione concettualmente multi- dimensionale dei dati, gestiscono grandi moli di dati in modo rapido, curano le politiche di accesso e condivisione dei dati e supportano nuove operazioni molto frequenti nelle attivit a di analisi dei fenomeni organizzativi come il roll up e il drill down. La classica denizione di Data Warehouse tratta dal manuale [20] cita: \...un DW e una copia dei dati transazionali specicatamente strutturata per operazioni di estrazione e analisi dei dati..." 1

Laurea liv.II (specialistica)

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Paolo Parise Contatta »

Composta da 113 pagine.

 

Questa tesi ha raggiunto 227 click dal 23/08/2011.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.