Gli strumenti elettronici a disposizione del traduttore: situazione attuale e prospettive future

Il web come corpus

Si vuole ora cercare di capire se anche il web possa essere considerato un corpus e se in quanto corpus può risultare utili per le traduzioni.
Innanzitutto il web è considerato un enorme contenitore di materiale testuale, di facile accesso, gratuito e caratterizzato da una varietà di stili, tipologie e contenuti linguistici (Chiari, 2007).
Se, secondo le definizioni che vengono fornite da diversi autori come ad esempio McEnery e Wilson (1996), un corpus è una raccolta di testi usata come campione di una lingua, allora anche il web può essere definito un corpus, poiché raccoglie testi in varie lingue e appartenenti a diverse tipologie testuali.
Resnik e Smith (2003: 350) in particolare vedono il web "as a great big body of text waiting to be mined, a huge fabric of linguistic data often interwoven with parallel threads".

Comparando il web ad un corpus tradizionale si possono trovare sia vantaggi che svantaggi come spiega Spousta (2006), in termini di estensione, poiché corpora basati su testi tratti dal web possono essere molto ampi, e inoltre la grandezza del web è in continua espansione; in termini di qualità dei tesi e la loro rappresentatività: ci sono molte differenti fonti di informazioni sul web e non è possibile controllare il suo contenuto ma allo stesso tempo, data l'enorme quantità di testi disponibili, è possibile filtrare testi inappropriati, mantenendo comunque il corpus di grandi dimensioni; in termini di stabilità temporale poiché il web cambia costantemente, nuove pagine vengono aggiunte ed altre rimosse; infine per quanto riguarda i diritti di distribuzione del materiale in quanto molte pagine web sono coperte da copyright e non possono essere usate se violano i diritti d'autore e a volte non si può identificare l'autore dei contenuti.

Si è accennato alla rappresentatività del web come corpus. Un corpus per essere rappresentativo di una lingua deve contenere diverse tipologie testuali in maniera bilanciata, che presentino le diverse situazioni comunicative e le diverse varietà di una determinata lingua. Il web però non presenta tutte le varietà di una lingua, di conseguenza non può essere rappresentativo. Inoltre i motori di ricerca che vengono interrogati per ricercare le informazioni sul web come Google o YahooSearch, privilegiano i siti più autorevoli e quindi non vi è una selezione bilanciata di testi formali, informali, appartenenti a diverse tipologie testuali.

Anche dal punto di vista delle lingue presenti sul web vi è uno squilibrio enorme. Xu (2000) ha stimato che il 71 % delle pagine web è scritta in inglese, seguite dal giapponese (6,8%), tedesco (5,1%), francese (1,8%), cinese (1,5%), spagnolo (1,1%), italiano (0,9%) e svedese (0,7%).
Inoltre i testi che vengono pubblicati sul web possono essere scritti da una varietà di autori e ciò comporta un tasso di errori significativamente più alto rispetto ai testi stampati, che vengono raccolti e controllati. Non si tratta solo di errori di battitura o scannerizzazione, ma anche di errori prodotti da persone che scrivono dei testi in una lingua che non è la loro madrelingua e di cui non conoscono perfettamente le regole e le caratteristiche linguistiche (Chiari, 2007; Kilgariff e Grefenstette, 2003).
Kilgariff e Grefenstette (2003: 342) affermano quindi che "All the "erroneous" forms exist, but much less often than the "correct" forms. The web is a dirty corpus, but expected usage is much more frequent than what might considered as noise".

Lo scopo principale che ci interessa per il nostro ambito di ricerca è considerare il web uno strumento utile al lavoro del traduttore. I traduttori hanno infatti trovato nel web uno strumento utile per cercare come una determinata parola o frase viene usata all'interno di un contesto e quale è la sua frequenza d'uso (Volk, 2002).
Inoltre nel web si possono trovare i testi paralleli, che hanno avuto un ruolo importante nella traduzione automatica e nel trattamento automatico del linguaggio.
Resnik (1999) a tal proposito ha sviluppato un metodo per ricercare automaticamente i testi paralleli nel web, chiamato STRAND. È un'architettura per structural translation recognition, acquiring natural data. Il suo obiettivo è quello di individuare coppie di pagine web che sono traduzioni reciproche, attraverso diverse strategie e filtri.

Il web offre quindi molte risorse non solo come corpus, ma permette di trovare qualsiasi tipo di informazione. Per quanto riguarda la traduzione di testi o parte di essi, da parte di utenti generali o traduttori professionisti, il web permette non solo di consultare diverse tipologie di dizionari e altri strumenti linguistici come banche dati terminologiche, corpora ecc, ma anche di utilizzare i sistemi di traduzione automatica gratuiti.

Questo brano è tratto dalla tesi:

Gli strumenti elettronici a disposizione del traduttore: situazione attuale e prospettive future

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Informazioni tesi

Autore:	Marta Radico
Tipo:	Tesi di Laurea Magistrale
Anno:	2012-13
Università:	Università degli Studi di Roma La Sapienza
Facoltà:	Lettere e Filosofia
Corso:	Scienze Linguistiche, letterarie e della traduzione
Relatore:	Isabella Chiari
Lingua:	Italiano
Num. pagine:	131

FAQ

Come consultare una tesi

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni

Perché consultare una tesi?

Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:

perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.

Clausole di consultazione

L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.

Vuoi tradurre questa tesi?

L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.

Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

traduzione

linguistica computazionale

traduzione automatica

automatic translation

dizionari elettronici

machine translation

cat tools

traduzione assistita

Tesi correlate

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

individua con precisione le parole chiave specifiche della tua ricerca
elimina i termini non significativi (aggettivi, articoli, avverbi...)
se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
utilizza la ricerca avanzata
utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

Leggi la guida

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi

Scopri di più

Chi siamo

Contattaci

Gli strumenti elettronici a disposizione del traduttore: situazione attuale e prospettive future

Il web come corpus

Questo brano è tratto dalla tesi: