Skip to content

L’annotazione nella linguistica dei corpora

La formattazione dei documenti e l’elaborazione di un software adeguato sono condizioni necessarie per giungere a visualizzare velocemente le concordanze delle parole selezionato. Facendo riferimento al formato KWIC (Key Word in Context), la parola in esame viene presentata al centro dello schermo, nell’ambito del contesto di ricorrenza.

Un problema si pone nell’interrogazione del data base corpus, ad esempio nel caso di una lingua ricca di forme flesse come l’italiano. Necessario è il ricorso ad esempio a opportuni criteri per evitare le interferenze di omografi e non invalidare il calcolo di frequenza delle concordanze.

di Domenico Valenza
Valuta questo appunto:

Continua a leggere:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.