Skip to content

Computational Linguistics and Lexicography: English Monolingual General Purpose Doctionaries Freely Available on the Internet

Informazioni tesi

  Autore: Jitka Horcickova
  Tipo: Tesi di Laurea
  Anno: 2003-04
  Università: Università Cattolica del Sacro Cuore di Brescia
  Facoltà: Lingue e Letterature Straniere
  Corso: Lingue e Letterature Straniere
  Relatore: Guido Milanese
  Lingua: Inglese
  Num. pagine: 221

Monolingual general purpose dictionaries have been chosen as a subject of this thesis because of their special position in all societies, and in the English-speaking community in particular. Owing to the numerous influences on the language in different parts of the world, English has probably the richest vocabulary of all languages, but it has never been possible to establish a standard. Italy and France have academies to provide guidance and authority in linguistic questions; English speakers have turned to dictionaries. Dictionaries have been important for keeping track of the development of the language, especially since English gained the status of a global language. Cyberspace is a conceptual place where people from all around the world meet to collaborate; to be able to communicate they need a common language: this language is English. Many people use the Internet in order to learn English: they need valuable reference works, and their free availability is essential especially for those who live in the less rich parts of the world.

In order to evaluate the dictionaries found during the meticulous Internet research over an extended period of time, we have first laid foundations for the methodology to be adopted. After a short explanation of the terms and description of the main steps in the development of English and American lexicography in chapters 1 and 2, in chapter 3 we have studied the main principles of lexicography, and analyzed in detail the structure of the printed monolingual dictionary. Particular attention was paid to the microstructure, especially to the composition of information within the entries because online dictionaries should provide at least the same information as their printed counterparts.

In chapter 4 we have looked at the all-embracing effect that the advent of computers has had on dictionary making. Large computer corpora have enabled lexicographers to take a completely different view on the language: instead of relying on their fine linguistic sensitivity only, they suddenly have quantitative evidence on how the language is actually used. Creating an adequate corpus is a very long and expensive process; consequently, standards of encoding have been created that allow exchange of data between different systems in order to put several resources together. In this chapter we have described main markup languages: SGML, XML, HTML, XHTML.

The macrostructure of an online dictionary described in chapter 5 is completely different from the printed one as it does not refer to an artifact, but rather to a virtual dictionary which only exists in a particular moment on the screen of a particular user, and which may be accessed in different ways. The main characteristic of hypertext is that it is not permanent: any user creates their own route to information; they are active in acquiring knowledge. Information retrieval facility is a distinguishing feature of electronic dictionaries and the possibility to add multimedia information is another special feature of electronic medium.

After having outlined a detailed typology of online dictionaries in chapter 6, in chapter 7 we have examined how the English monolingual general purpose dictionaries make use of the electronic medium in different ways and to a different extent. We have identified two kinds of monolingual general purpose dictionaries online: digitized printed dictionaries and original electronic dictionaries. We have created a table of parameters for equal formal validation and validation of content of the dictionaries and listed their main features in order to draw a conclusion about the usefulness of the English monolingual general purpose dictionaries freely available on the Internet.

The future of the publishing industry has been frequently questioned after the advent of the Internet. The financial part of the enterprise plays an important role in the development of original dictionaries, and has crucial implications for the future of the dictionary making. The ideal situation would be close collaboration between Natural Language Processing researchers and lexicographers to produce electronic dictionaries which would have both, high lexicographic quality and sophisticated computing functions.

Informazioni tesi

  Autore: Jitka Horcickova
  Tipo: Tesi di Laurea
  Anno: 2003-04
  Università: Università Cattolica del Sacro Cuore di Brescia
  Facoltà: Lingue e Letterature Straniere
  Corso: Lingue e Letterature Straniere
  Relatore: Guido Milanese
  Lingua: Inglese
  Num. pagine: 221


La consultazione è esclusivamente in formato digitale .PDF

Mostra/Nascondi contenuto.
Introduction Since the 1940’s the Information Technology1 revolution has slowly af- fected the whole spectrum of everyday life worldwide. Hardware prices have continued to drop, its efficiency has been increasing exponentially, and more and more sophisticated software has been created. Gordon Moore, the co-founder of Intel2, predicted in 1965 that the number of transistors the industry would be able to place on a computer chip would double every couple of years (Moore, 1965): it was called ’Moore’s Law’, and it has operated relentlessly since then. But “the speed with which things are developing on the Internet is unlike anything we have experienced before” (Rundell, 1996). The Internet3 was born in the United States originally for defence reasons: the communication between military commands in case of a nuclear war was the priority. In the 1980s the Internet entered aca- demic life to ease the communication between the US universities. Ma- jor research into the Information Technology sector was, again, made in the United States. As a consequence, English, especially in its Ameri- can variety, became the universal language of the Information Technol- ogy: in fact, the majority of current programming languages are based on the English language. Since 1989 the World Wide Web has revolutionized the communica- tion between people all over the planet. Its creator Tim Berners-Lee had a dream of “a common information space in which we commu- 1For the terms written in italic, see the Glossary of terms on page 161. “Double quotation marks” indicate an exact shorter quotation from a work cited in bibliogra- phy, while longer quotations will constitute a separate paragraph. ’Single quotation marks’ indicate examples. An asterisk indicates a wrong form of o word or *fraze, apart from being the wildcard to substitute any string of characters. 2Gordon Moore’s Home Page at Intel kits/bios/moore.htm 3A short introduction to Internet can be found on uni/papers/www/www.htm. For more detailed information see htm 5


La consultazione è esclusivamente in formato digitale .PDF



Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni
Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:
  • perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
  • perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
  • perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio
  • L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
  • Nel caso in cui l'Utente volesse pubblicare o citare una tesi presente nel database del sito deve ottenere autorizzazione scritta dall'Autore della tesi stessa, il quale è unico detentore dei diritti.
  • L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.
  • L'Utente è a conoscenza che l'importo da lui pagato per la consultazione integrale della tesi prescelta è ripartito, a partire dalla seconda consultazione assoluta nell'anno in corso, al 50% tra l'Autore/i della tesi e Tesionline Srl, la società titolare del sito
L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

dizionari elettronici
lingua inglese
linguaggio di marcatura
linguistica computazionale
linguistica dei corpora
natural language processing
tipologia dei dizionari

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

  • individua con precisione le parole chiave specifiche della tua ricerca
  • elimina i termini non significativi (aggettivi, articoli, avverbi...)
  • se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
  • utilizza la ricerca avanzata
  • utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi