Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Big Data: Quali opportunità per le imprese

Laurea liv.I

Facoltà: Economia

Autore: Simona Ugolini Contatta »

Composta da 61 pagine.

 

Questa tesi ha raggiunto 5215 click dal 20/07/2017.

 

Consultata integralmente una volta.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.

 

 

Estratto della Tesi di Simona Ugolini

Mostra/Nascondi contenuto.
28  HDFS (Hadoop Distribuited File System) E’ il file system distribuito 8 principale utilizzato dalle applicazioni Hadoop, esso permette l’archiviazione di file in cluster 9 di computer che vengono visti come una sola unità di memorizzazione. Un cluster è principalmente composto da NameNode, che gestiscono i metadati del file system, e DataNode in cui vengono memorizzati effettivamente i dati. I NameNode hanno anche il compito di creare, distruggere, modificare e leggere i file. Per esempio, quando un file deve essere creato, questo viene diviso in segmenti, i quali poi sono distribuiti tra i vari DataNode del cluster, anche in maniera ridondante per evitare eventuali perdite di informazioni causate da guasti o malfunzionamenti. I NameNode contengono poi le istruzioni per ricomporre i vari segmenti, ricostruendo il file per la lettura. Tramite queste scomposizioni, HDFS riesce a immagazzinare un’enorme quantità di dati, ottimizzando le operazioni di archiviazione e accesso a un numero relativamente piccolo di file molto grandi.  YARN (Yet Another Resource Negotiator) E’ una piattaforma il cui ruolo primario è quello di programmare e gestire le risorse computazionali di un cluster Hadoop. L'idea fondamentale di YARN è di dividere le funzionalità di gestione delle risorse e il processo di pianificazione/controllo in demoni 10 separati. 8 File system: meccanismo con il quale i file sono posizionati e organizzati, su un dispositivo di archiviazione o su una memoria di massa. Si dice distribuito quando permette di accedere ai file contenuti su un computer remoto tramite rete, potenzialmente in simultanea da diversi computer. (Wikipedia, File system, 2016) 9 Cluster: un insieme di computer connessi tramite una rete telematica. (Wikipedia, Computer cluster, 2017) 10 Demone (daemon): in informatica, nei sistemi Unix, e più in generale nei sistemi operativi multitasking, un demone è un programma eseguito in background, cioè senza che sia sotto il controllo diretto dell'utente, tipicamente fornendo un servizio all'utente. (Wikipedia, Demone (informatica), 2016)
Estratto dalla tesi: Big Data: Quali opportunità per le imprese