Skip to content

I corpora nella tradizione linguistica

Lo sviluppo rapido che ha caratterizzato l’accessibilità dell’hardware e la produzione di programmi software ha mutato le modalità di indagine dei dati linguistici. Gli inizi della linguistica dei corpora si possono rintracciare nella tradizione della scuola britannica.

La raccolta di dati e la costituzione di corpora hanno una lunga tradizione negli studi linguistici. La linguistica dei corpora si ricollega a questa tradizione caratterizzandosi per la memorizzazione elettronica dei dati, l’autenticità dei testi costitutivi e la loro rappresentatività.

L’analisi delle parole nel contesto di ricorrenza rende possibili sia l’analisi della collocation, come l’insieme delle parole che le accompagnano più frequentemente, sia della colligation, come interrelazione delle categorie grammaticali nella struttura sintattica.

Il corpus può essere definito come una raccolta, in formato elettronico, di testi autentici e ricorrenti nell’uso, realizzata sulla base di criteri espliciti al fine di costruire una campionatura equilibrata e rappresentativa di uno stato o di una varietà di una lingua. Dei vari aspetti del corpus, due in particolare sono posti come caratterizzanti: l’autenticità e la rappresentatività.
di Domenico Valenza
Valuta questo appunto:

Continua a leggere:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.