Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Scelte razionali nella scoperta ed uso della conoscenza

In questa tesi si è cercato un avvicinamento concettuale tra le svariate tecniche di data mining oggi a nostra disposizione ed un’univoca versione di queste legata alla scoperta della conoscenza intesa come eventi riscontrabili nei dati, che in una qualche misura vincolano la presenza di altri eventi non più imputabili solamente al caso. A tal proposito si sono analizzate alcune famiglie di tecniche di data mining oggi a disposizione mettendo in risalto quali siano i limiti in cui si incorre nell’adottare alcune tecniche rispetto ad altre.
Gli approcci “Instance Based Learning” hanno il pregio di effettuare buone predizioni anche in presenza di comportamenti complessi nei dati che difficilmente potrebbero essere espressi da modellazioni parziali delle informazioni. Le tecniche instance based funzionano abbastanza bene quando il presupposto (bias) di ritenere simili due oggetti non distanti tra loro risulta verificato. Purtroppo tale presupposto viene a cadere soprattutto in dati ad alta dimensionalità, dove l’elevato numero di attributi fa sì che molti di essi risultino irrilevanti ai fini della similarità, allontanando di fatto, dal punto di vista della distanza, oggetti che in realtà sono simili.
Gli approcci “Supervised Learning” ed ansiosi (eager), permettono di estrarre modelli parziali ed approssimati dei dati, determinando, ad esempio, il ruolo che ogni attributo assume nel comportamento dei dati ed eliminando così il problema degli attributi irrilevanti. Tali approcci possono non essere utilizzabili in tutti quei casi in cui gli attributi da predire non sono determinabili a priori ma variano di volta in volta generando un insieme di possibili predizioni in quantità esponenziale.
Gli approcci “Unsupervised Learning” uniscono alla gestione instance based dei dati anche la comprensione della rilevanza o meno degli attributi responsabili dei fenomeni di intra-similarità all’interno dei clusters. Purtroppo le tecniche non supervisionate soffrono in una certa misura di almeno una delle seguenti patologie:
• Computazionalmente Complessi
• Afflitti da Over or Under – Fitting
• Senza gestione della multi appartenenza (pag. 8)
La tesi propone un algoritmo di classificazione non supervisionata con l’obiettivo di unire le potenzialità degli approcci instance based e delle tecniche non supervisionate, cercando di ridurre le patologie associate a tali tecniche, al fine di ottenere un algoritmo non supervisionato con capacità predittive pari a quelle degli approcci supervisionati.

Mostra/Nascondi contenuto.
1 Capitolo 1 Introduzione alla Scoperta della Conoscenza La conoscenza [KNOW] viene usualmente definita come consapevolezza e comprensione di fatti, verità o informazioni, ottenute attraverso l‘esperienza o l‘introspezione, trova la sua utilità nell‘uso che facciamo di essa e risulta fortemente legata agli obiettivi che vogliamo raggiungere. Dato un obiettivo, potremmo andare alla ricerca, nel nostro bagaglio di conoscenza, delle condizioni di contorno che in qualche modo influenzano o determinano il raggiungimento di tale obiettivo, oppure inversamente, date un insieme di condizioni di contorno, che delineano il contesto in cui ci troviamo, potremmo essere interessati agli effetti che tali condizioni sono capaci di indurre. La scoperta della conoscenza trova applicazione nella nostra vita sin da piccoli, quando cioè le informazioni che riceviamo ci dicono cosa fare e non fare per il raggiungimento dei nostri obiettivi, andando da semplici considerazioni: ―non toccare il fuoco altrimenti ti bruci‖ a forme più elaborate che includono ricerca, pianificazione e capacità di induzione.

Laurea liv.II (specialistica)

Facoltà: Ingegneria

Autore: Marco Gramuglia Contatta »

Composta da 133 pagine.

 

Questa tesi ha raggiunto 405 click dal 31/07/2009.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.