Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Implementazione di un Query Language per Knowledge Discovery

La ricerca si è spinta negli ultimi anni verso un settore dell’informatica ed in particolare dei sistemi per la gestione dei dati conosciuto con l’acronimo di KDD (Knowledge Discovery in Databases). Mentre gli attuali DBMS si occupano di memorizzare ed organizzare i dati di interesse della corporazione, il KDD si propone di mettere a disposizione dell’analista gli strumenti per analizzare, capire e visualizzare la conoscenza contenuta in tali dati.
Una definizione poco tecnica del KDD ma che rende almeno parzialmente l'idea del target annunciato da questo settore di ricerca è la seguente: "Il KDD è un metodo per “torturare” i dati finché questi non confessano".
Allo stato attuale, numerosi ricercatori sono stati in grado di porre le basi per trattare il KDD come processo di query e hanno dettato le condizioni che dovrebbe soddisfare un query language (QL) in grado di supportarlo.
In questo contesto, l’idea è realizzare un QL che permetta di combinare e condividere differenti modelli per l’estrazione della conoscenza ad alto livello da grosse quantita' di dati.
Ogni modello di dati che rappresenta l’informazione estratta non è vincolato quindi ad essere trattato separatamente, ma attraverso un frame-work unico si consente di confrontare e manipolare informazione appartenente a livelli di astrazione differenti a supporto delle diverse fasi del processo KDD.
In questa tesi viene quindi implementato un linguaggio per KDD utilizzando XML come base per la rappresentazione della conoscenza e Java come linguaggio di programmazione.

Mostra/Nascondi contenuto.
Introduzione 1 Introduzione Nella realtà odierna, l’utilizzo di sistemi automatici per l’elaborazione dell’informazione è diventato un aspetto strategico per l’organizzazione delle aziende e per la crescita ed il mantenimento della loro competitività. In genere, le informazioni memorizzate ed elaborate da tali sistemi hanno un duplice utilizzo nell’ambito di una azienda od organizzazione: sono infatti usate per scopi operativi e come base per il supporto alle decisioni (DSS - Decision Support System). Al momento attuale, non è insolito che un DSS contenga milioni o anche centinaia di milioni di record di dati. Si consideri per esempio un’agenzia di carte di credito che deve memorizzare i dati relativi agli acquisti effettuati dai suoi clienti. Supponiamo che ognuno di loro effettui mediamente 10 transazioni in un mese, 120 per anno. Con 3 milioni di clienti e 5 anni di dati, è facile prevedere come la velocità di crescita di tali dati vada ben aldilà della capacità di controllo umana. In definitiva, i dati possono essere considerati la spina dorsale per il funzionamento di qualsiasi organizzazione, di qualunque tipo e dimensione. Nasce quindi l’esigenza di strumenti ad hoc, quali i Data Base Management System (DBMS), in grado di raccogliere, memorizzare ed elaborare in modo automatico l’informazione. Questa necessità è andata di pari passo con il drastico abbassamento del rapporto prezzo/capacità dei supporti di memorizzazione cui si è aggiunto il potenziamento delle capacità di calcolo dei moderni elaboratori che hanno offerto sinora, e continueranno ad offrire in futuro, un robusto strumento per raccogliere ed organizzare tali dati. Ma raccogliere ed organizzare i dati non è sufficiente; questi devono anche essere analizzati, compresi e trasformati in informazione utile, obiettivi difficili da raggiungere con la tecnologia dei moderni DBMS.

Tesi di Laurea

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Andrea Romei Contatta »

Composta da 231 pagine.

 

Questa tesi ha raggiunto 1054 click dal 10/06/2004.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.