Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Correlation rules: analisi di una tecnica di data mining e sua applicazione ai sistemi di telecomunicazione

Il Data Mining è una moderna disciplina volta all’estrazione da grosse moli di dati di pattern utili e facilmente comprensibili, altrimenti difficilmente utilizzabili. In questa tesi si vuole in particolare trattare una nuova tecnica di Data Mining: le correlation rules (evoluzione delle più diffuse association rules), che permettono di estrarre da dataset di elevate dimensioni pattern composti da oggetti fra loro fortemente correlati.
Per un’efficace applicazione di questa tecnica viene messa in evidenza l’importanza di utilizzare un’adeguata misura di interesse da applicare ai pattern estratti. In questa tesi vengono presentate ed analizzate le misure più note in letteratura, e ne viene inoltre sviluppata una di nuova, tesa a superare i limiti di quelle fino ad ora sviluppate.
Lo studio procede poi generalizzando queste misure per renderle applicabili a pattern di dimensione arbitraria, ed introducendo il concetto di confrontabilità fra pattern di dimensione diversa, per arrivare allo sviluppo di alcune nuove normalizzazioni da applicare alle misure tradizionali al fine di renderle consistenti con questo concetto.
Il framework sviluppato viene applicato, nella parte conclusiva dello studio, per proporre una soluzione ad un problema molto sentito dai gestori delle reti di telecomunicazioni: il fenomeno dell’alarm storm, l’elevato numero di allarmi segnalati da queste reti, che, proprio a causa della loro eccessiva quantità, sono spesso di scarso aiuto nella diagnosi dei problemi di network che ne sono causa.

Mostra/Nascondi contenuto.
8 1 Introduzione La nostra capacit� sia di generare che di raccogliere dati � andata rapidamente crescendo nelle ultime decadi; l�elevata mole di informazioni accumulate spesso nasconde al proprio interno informazioni concretamente sfruttabili ma difficilmente estraibili con i tradizionali strumenti di analisi; a questo proposito si sta sviluppando in questi anni una nuova disciplina, il Data Mining, che permette l�estrazione dell�informazione nascosta, presentandola poi all�utente sotto forma di pattern utili e facilmente comprensibili. Una tecnica di data mining molto diffusa ed utilizzata � l�estrazione delle association rules. Un problema tipico che si risolve generalmente con questa tecnica � la cosiddetta analisi dei carrelli della spesa: grazie ad essa si possono estrarre pattern che permettono di capire quali articoli il cliente tende ad acquistare contemporaneamente, informazione molto utile ad esempio per poter pianificare opportune campagne di marketing. Un esempio di regola estraibile con le association rules � la seguente: Se il cliente acquista latte, allora con una probabilità del 75% acquista anche zucchero La percentuale del 75%, che rappresenta l� �affidabilit�� della regola, viene detta confidenza. Questa misura, per�, in alcune situazioni � fuorviante: e se lo zucchero fosse comunque presente nel 75% di tutti i carrelli? L�utente vedendo la regola potrebbe erroneamente concludere che il latte incentiva l�acquisto dello zucchero (che invece in realt� non ne viene minimamente influenzato), e intraprendere errate campagne di marketing (ad esempio, proporre sconti sul latte nella speranza di aumentare anche le vendite dello zucchero). Per risolvere questo ed altri problemi, sono state proposte in letteratura le correlation rules, che permettono di estrarre regole del tipo: Latte e zucchero hanno una correlazione dell’87%

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Paolo Salvan Contatta »

Composta da 97 pagine.

 

Questa tesi ha raggiunto 1072 click dal 20/03/2004.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.