Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Anglicismi nel francese contemporaneo: tecniche di ricerca computazionale su un corpus giornalistico

Lo scopo della nostra ricerca è quello di dimostrare come e quanto l'informatica può essere d'aiuto al lavoro del linguista o del filologo.

Nel nostro specifico caso abbiamo svolto un lavoro di tipo lessicale cercando di individuare nella maniera più precisa possibile la presenza di anglicismi all'interno della lingua francese, e abbiamo utilizzato come specchio della realtà della lingua il quotidiano \emph{Le Monde}. Perché il giornale? Perché esso è chiaramente aperto a tutti gli influssi linguistici, è luogo di scambio tra lingua parlata e scritta dove tutte le varietà della lingua sono (ri)elaborate.

La linguistica computazionale è una materia {}``sperimentale'', si basa quindi su veri e propri esperimenti per ricercare nuovi metodi e nuove tecniche in un dato campo (in questo caso della linguistica).\\

Nel primo capitolo tenteremo di restringere il campo della nostra ricerca definendo il concetto di neologia, e più precisamente di neologia da prestito. Verrano presentate classificazioni e problematiche rispetto al prestito. Si procederà in seguito alla descrizione della politica linguistica francese.

Il secondo capitolo presenterà i criteri di scelta del nostro corpus e passo dopo passo le varie fasi informatiche esponendo il ruolo degli strumenti utilizzati all'interno della nostra ricerca. Si partirà dall'analisi della tipologia di file del nostro corpus giungendo all'estrazione di file di puro testo, pronto quindi per l'ultima ma non meno importante fase.

Nel terzo capitolo si esporrà l'analisi ortografica che ci permetterà d'individuare gli anglicismi all'interno del nostro campione rappresentativo.
In questa fase si presenteranno come nel precedente capitolo gli strumenti impiegati, fino ad arrivare al risultato quantitativo della nostra ricerca: la lista di possibili anglicismi e le loro occorrenze. Si tratta quindi della parte più importante che ci permetterà di raggiungere il nostro obbiettivo. Col fine di rendere più schematica l'analisi saranno introdotte delle tabelle e dei grafici (istogrammi e torte) presentando alcuni dati significativi relativi al prestito (tipologia, contesto...).

Il quarto capitolo è dedicato ad un'analisi di diverso tipo. Dopo aver introdotto il concetto di lingue speciali, verrà scelto un campione tra gli anglicismi individuati. Saranno presentate tutte le parole che fanno parte del campo semantico dell'informatica assieme al loro contesto. Scopo di questo capitolo è dimostrare la capacità dell'estrazione automatica del contesto e ulteriori potenziali analisi linguistiche.

L'ultimo capitolo si concentra sulla redazione della nostra tesi presentando gli strumenti tecnologici e il loro funzionamento.\\

Oltre alla bibliografia è stato redatto l'indice analitico.

E' stata inoltre aggiunta un'appendice informatica con al suo interno i risultati della ricerca e i programmi utilizzati.

Mostra/Nascondi contenuto.
Premessa Il corpus di dati analizzato dal punto di vista informatico e linguistico nella presente ricerca e` molto esteso e comprende all’incirca 100.000 articoli pari alle annate di pubblicazioni 2001-2002 della testata giornalistica francese Le Monde (la cui distribuzione e consultazione e` stata gentilmente concessa dall’ Universita` Cattolica del Sacro Cuore di Milano, Ufficio Riviste). Il corpus rappresentativo dello stato della lingua, per nostra fortuna, era gia` in formato elettronico, quindi su computer, e ci ha permesso di elaborare la nostra ricerca in tempi ragionevoli, senza dover procedere allo scanning di materiale cartaceo. Tuttavia, come dimostreremo, abbiamo incontrato non pochi problemi nell’analisi dei dati in quanto organizzati in una maniera tutt’altro che omogenea. La nostra tesi propone al suo interno lo svolgimento delle operazioni in- formatiche e dei relativi risultati. Tutto cio` sara` inserito in un CD-Rom in modo tale da poter facilitare il compito di coloro che come me si possono identificare come i neofiti della linguistica computazionale, e volessero quindi affrontare un lavoro anche vagamente simile. Essa contiene: i programmi che sono stati utilizzati per l’ estrazione dei file di testo e la seguente classificazione (tagging), la dichiarazione del tipo del documento (dtd), il foglio di stile (css), il programma per estrarre solo la porzione di testo relativa ai titoli e al testo puro dell’articolo e le liste di possibili anglicismi suddivise tra testo e titolo. Inoltre verra` aggiunta la lista dei prestiti presente nella ricerca di Maria Teresa Zanola, ricerca che e` stata utilizzata come punto di partenza e come punto di riferimento per la nostra, ma che ci ha anche permesso di operare un’analisi di tipo comparativo. Oltre a cio`, nella stessa tesi verra` indicato tutto il materiale bibliografico che e` stato utilizzato per poter comprendere e implementare lavori speri- mentali di questo tipo, la maggior parte di questo distribuito freeware su Internet. 3

Tesi di Laurea

Facoltà: Lingue e Letterature Straniere

Autore: Simone Zesi Contatta »

Composta da 170 pagine.

 

Questa tesi ha raggiunto 4743 click dal 11/05/2004.

 

Consultata integralmente 9 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.