Skip to content

Big Data: un’applicazione di text mining a partire dallo scraping di un sito web sulle richieste di lavoro

Il presente lavoro ha come obiettivo quello di fornire una panoramica dell’attuale tema dei Big Data e di sviluppare una strategia di analisi di grandi quantità di dati a portata di un personal computer.
Nella prima parte verrà definito il concetto di Big Data e le implicazioni scientifiche e metodologiche che questo tema porta con sé. Come è noto infatti, Big Data è l’argomento degli ultimi dibattiti, la comunità scientifica sembra spaccarsi in due diverse prospettive sull’utilizzo e lo sfruttamento dei Big Data. Verranno forniti esempi di campi applicativi: le aziende infatti possono sfruttare il potenziale che deriva dall’analisi dei dati ed estrarre quelle informazioni utili in grado di indirizzare chi deve prendere le decisioni. Il problema è come estrarre l’informazione significativa dai vasti giacimenti di dati che si presentano di fronte a noi. Gli strumenti forniti dalla tecnologia e dall’informatica possono supportare gli analisti nella gestione di un informazione così sparsa e poco strutturata: in questa direzione si muovono i software e le tecniche di data e text mining che, con costi e tempi ridotti, possono ridurre la complessità informativa e contribuire a catturare il senso che c’è dietro una tale vastità di dati.
Nella seconda parte verrà fornita una strategia di analisi per raccogliere, pulire, trattare ed elaborare grandi quantità di dati testuali anche da un personal computer. A questo scopo, si è scelto di fare un semplice esperimento di scaricamento degli annunci di lavoro “postati” dalle imprese sul sito Subito.it. Big Data vuol dire analizzare grandi quantità di dati con l’intento di studiare l’intero fenomeno piuttosto che un campione ristretto. In questa applicazione sarebbe stato possibile scaricare tutti gli annunci, ma si è scelto di interrompere il download per un limite dimensionale dato dal software di analisi testuale dei dati.
Nella terza parte si è cercato di estrarre, senza ipotesi a priori, delle informazioni per andare a catalogare gli annunci sulla base di certe caratteristiche riferite alla posizione lavorativa e vengono fornite delle statistiche sui risultati ottenuti.
Nell’ultimo capitolo viene proposto un caso specifico dove vengono messe a sistema tutte le informazioni precedentemente individuate, con riferimento alle figure operanti nel settore immobiliare.
Una delle critiche che viene mossa all’utilizzo dei Big Data è che possano in qualche modo sostituire il lavoro degli scienziati: infatti c’è chi sostiene che gli algoritmi possano in toto sostituire il lavoro delle persone in “carne ed ossa”. Si vuole dimostrare, attraverso l’applicazione agli annunci di lavoro, che una conoscenza teorica del fenomeno che si vuole analizzare è la premessa per poter capire ed interpretare i dati. Se qualcuno sostiene che i dati “parlino da soli” è necessario che chi ascolta i dati “parli la stessa lingua”.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Mostra/Nascondi contenuto.
2 Introduzione Il presente lavoro ha come obiettivo quello di fornire una panoramica dell’attuale tema dei Big Data e di sviluppare una strategia di analisi di grandi quantità di dati a portata di un personal computer. Nella prima parte verrà definito il concetto di Big Data e le implicazioni scientifiche e metodologiche che questo tema porta con sé. Come è noto infatti, Big Data è l’argomento degli ultimi dibattiti, la comunità scientifica sembra spaccarsi in due diverse prospettive sull’utilizzo e lo sfruttamento dei Big Data. Verranno forniti esempi di campi applicativi: le aziende infatti possono sfruttare il potenziale che deriva dall’analisi dei dati ed estrarre quelle informazioni utili in grado di indirizzare chi deve prendere le decisioni. Il problema è come estrarre l’informazione significativa dai vasti giacimenti di dati che si presentano di fronte a noi. Gli strumenti forniti dalla tecnologia e dall’informatica possono supportare gli analisti nella gestione di un informazione così sparsa e poco strutturata: in questa direzione si muovono i software e le tecniche di data e text mining che, con costi e tempi ridotti, possono ridurre la complessità informativa e contribuire a catturare il senso che c’è dietro una tale vastità di dati. Nella seconda parte verrà fornita una strategia di analisi per raccogliere, pulire, trattare ed elaborare grandi quantità di dati testuali anche da un personal computer. A questo scopo, si è scelto di fare un semplice esperimento di scaricamento degli annunci di lavoro “postati” dalle imprese sul sito Subito.it. Big Data vuol dire analizzare grandi quantità di dati con l’intento di studiare l’intero fenomeno piuttosto che un campione ristretto. In questa applicazione sarebbe stato possibile scaricare tutti gli annunci, ma si è scelto di interrompere il download per un limite dimensionale dato dal software di analisi testuale dei dati.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista
Il miglior software antiplagio

L'unico servizio antiplagio competitivo nel prezzo che garantisce l'aiuto della nostra redazione nel controllo dei risultati.
Analisi sicura e anonima al 100%!
Ottieni un Certificato Antiplagio dopo la valutazione.

Informazioni tesi

  Autore: Andrea Kanneworff
  Tipo: Laurea II ciclo (magistrale o specialistica)
  Anno: 2016-17
  Università: Università degli Studi di Roma La Sapienza
  Facoltà: Economia
  Corso: Scienze dell'economia
  Relatore: Maria Felice Arezzo
  Lingua: Italiano
  Num. pagine: 87

FAQ

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

analisi
web
data mining
dati
mining
analytics
taltac
big data
crawling
scraping

Tesi correlate


Non hai trovato quello che cercavi?


Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti


Come si scrive una tesi di laurea?


A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.


La tesi l'ho già scritta,
ora cosa ne faccio?


La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi