Skip to content

Il vocabolario di base tra frequenza, dispersione e disponibilità

Il vocabolario di base o fondamentale di una lingua, quello condiviso da tutti i parlanti di una comunità linguistica, dovrebbe essere formato da parole comuni in accezioni comuni. Selezionare le parole che fanno parte di un vocabolario di base è dunque operazione delicata.

Gli spogli di testi danno liste di frequenza: la frequenza però può essere poco significativa se il corpus non è ben bilanciato, cioè non è costituito da tipi di testi diversi. Inoltre, per ragioni casuali, una parola potrebbe essere usata moltissimo e poi tornare a essere usata poco; è necessario calcolare la dispersione di una parola, cioè fare la media della sua frequenza nei vari tipi di testo. Oltre la dispersione, altro valore spesso fornito è il cosiddetto coefficiente di variazione, una combinazione della frequenza e della dispersione, detto anche uso della parola.

di Domenico Valenza
Valuta questo appunto:

Continua a leggere:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.