Sei nella pagina Dizionari online e corpora linguistici

Selettore lingua



Dizionari online e corpora linguistici

dizionari online monolingua | dizionari bilingue e multilingue | traduttori automatici | corpora di lingua italiana | corpora di altre lingue | enti


Dizionari monolingua

Francese
Dictionnaire de l'Academie Française
versione online parziale (dalla lettera "A" a "Promesse") della 9. edizione del celebre dizionario la cui prima edizione vide la luce nel 1694. La corrente edizione, in corso di pubblicazione, è iniziata nel 1992.

Le Trésor de la Langue Française informatisé
versione online del dizionario storico pubblicato in 16 volumi da Gallimard sulla lingua dei secoli XIX e XX ; servizio curato da ATILF, CNRS e Universitè de Nancy
Inglese

Merriam-Webster online
versione online della 10. edizione a stampa del celebre dizionario completo di definizioni, pronuncia, etim. e uso dei lemmi; è disponibile anche un thesaurus

Middle English Dictionary
dizionario online dell'inglese medievale (1100-1500), basato sull'analisi di una collezione di oltre 3 milioni di citazioni. Questo dizionario, che contiene integralmente la corrispondente vers. a stampa, fa parte di Middle English Compendium, progetto digitale curato da Michigan University Library e Michigan University Press che presenta una serie di strumenti utili per lo studio dell'inglese m.evale (corpora, bibliografie, cataloghi di ms, ecc).

Italiano

Dizionario online Hoepli
dizionario tratto da: Grande dizionario italiano con CD-ROM / di Aldo Gabrielli

Dizionario.org
versione web del famoso Dizionario della Lingua Italiana di Niccolò Tommaseo e Bernardo Bellini, uscito in 8 tomi negli anni 1861-1879. E' attualmente disponibile la prima parte dell'opera che copre le lettere A-G, per circa 55.000 voci. Benche' ovviamente superato, le capillari ricerche da cui esso scaturì e la mole sterminata raggiunta nel corso della redazione lo fanno restare utile e – come Bruno Migliorini scriveva nel suo Che cos'e un vocabolario? – indispensabile.

DOP: Dizionario italiano multimediale e multilingue d'Ortografia e Pronunzia
il DOP, redatto in origine da Bruno Migliorini, Carlo Tagliavini e Pietro Fiorelli, si presenta qui in una versione multimediale, sotto l'egida della RAI, riveduto aggiornato e accresciuto da Pietro Fiorelli e Tommaso Francesco Borri. Per maggiori informazioni vedi la guida.

Portoghese
Lingua Portuguesa Online
dizionario ricco di circa 100.000 termini, 13.000 congiugazioni di verbi, riconoscimento delle forme flesse e grammatica online; curato da Priberam Informatica
Spagnolo

Diccionario de la Lengua Española de la Real Academia Española
versione online integrale della 22. ed. (2001) del dizionario della Real Academia Española (RAE). Il dizionario, grazie alla collaborazione di 21 accademie che con la RAE si integrano nella Asociación de Academias de la Lengua Española, si pone come norma linguistica panispanica.

Nuevo Tesoro Lexicográfico de la Lengua Española
pubblicato dalla Real Academia Española e da Editorial Gredos, questo importante strumento storico-lessicografico permette di consultare in riproduzione digitale facsimilare il contenuto di 66 dizionari spagnoli che rappresentano l'evoluzione della lingua castigliana nell'arco degli ultimi 5 secoli.

Tedesco

Das Deutsche Wörterbuch von Jacob und Wilhelm Grimm im Internet
versione online 2.0 (2003) del dizionario storico monolingua del tedesco, iniziato dai fratelli Grimm e pubblicato in 16 volumi a stampa dall'editore Hirzel di Lipsia dal 1854 al 1960.
Progetto digitale realizzato da Universität Trier in collaborazione con Akademie der Wissenschaften und der Literatur, Mainz, sotto il patrocinio del Ministero della Cultura tedesco.

Das Goethe-Wörterbuch im Internet
versione online del dizionario storico della lingua di Goethe, nell'ed. 1978-1999 curata da Berlin-Brandenburgischen Akademie der Wissenschaften, Deutsche Akademie der Wissenschaften zu Berlin, Akademie der Wissenschaften der DDR, Akademie der Wissenschaften in Göttingen e Heidelberger Akademie der Wissenschaften.
Progetto digitale realizzato da Kompetenzzentrums für elektronische Erschliessungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier in collaborazione con Interakademischen Kommission für das Goethe-Wörterbuch.

Wortschatz Lexikon
dizionario corrente online della lingua tedesca. Progetto curato dall'Università di Lipsia.


Dizionari bilingue e multilingue

bab La
la sezione Dizionario del portale linguistico bab La, progetto curato da Andreas Schroeter e Patrick Uecker (Amburgo), rende disponibili dizionari multilingue che non forniscono una semplice traduzione meccanica dei lemmi ma sono arricchiti con esempi contestualizzati e le registrazioni delle corrette pronunce.

Free Online Dictionary
servizio di traduzione reciproca dall'inglese in 16 diverse lingue, comprese alcune poco diffuse (swahili, norvegese, giapponese, indonesiano, afrikaans)

From language to language
dizionario multilingue online; fornisce un servizio di traduzione relativo alle più diffuse lingue occidentali e slave; traduzione anche per l'esperanto e lo swahili.

Grande dizionario Hoepli Inglese / di Fernando Picchi
(accesso riservato alle postazioni in rete di ateneo)
dizionario bilingue corrente inglese-italiano italiano-inglese

InterActive Terminology for Europe (IATE)
database terminologico inter-istituzionale dell'Unione Europea nato nel 2004 per la raccolta e la condivisione tra istituzioni europee di termini lessicali specialistici che possono essere tradotti nelle diverse lingue comunitarie selezionando l'ambito di riferimento.

Langenscheidt e-Handwörterbuch : Italienisch-Deutsch, Deutsch-Italienisch
(accesso riservato alle postazioni in rete di ateneo)
dizionario bilingue corrente tedesco-italiano italiano-tedesco

Lexicool.com
il sito si dichiara un "repertorio di dizionari bilingui e plurilingui" ed effettivamente si configura come uno dei principali servizi di ricognizione di strumenti di questo genere disponibili online, avendone censiti oltre 4mila. L'interfaccia di ricerca disponibile sulla home page non traduce direttamente i termini ma fornisce una lista di strumenti di traduzione disponibili online per l'analisi delle lingue definite nei criteri di scelta.

Logos multilingual E-Translation Portal
questo sito mette a disposizione dizionari monolingue, bilingue e multilingue oltre a descrizioni grammaticali di sistemi linguistici molto diversi tra loro, in prospettiva sia tipologica che genetica. Il sito, curato da Logos, puo' rappresentare un valido strumento per una prima ricognizione sulle peculiarita' morofosintattiche di una lingua.

Shorter Oxford English dictionary on CD-ROM
Risorsa ad accesso riservato, da rete SNS. (istruzioni per scaricare il sw di consultazione)
versione elettronica della 5. ed. a stampa del celebre dizionario standard della lingua inglese, derivato dall'Oxford Eng. Dictionary. Raccoglie oltre 50000 voci, oltre 83000 citazioni ed esempi, etimologie ed un rimario

WordReference
dizionario di traduzione multilingue (inglese, francese, spagnolo, italiano). Il dizionario italiano-inglese, in grado di tradurre solo singole parole o frasi molto brevi, comprende circa 100.000 lemmi con più di 250.000 traduzioni ed è in continua crescita. E' corredato da un dizionario monolingue inglese.  

Traduttori automatici

avvertenza: i traduttori automatici possono essere di qualche aiuto solo nel caso in cui già si abbia una buona conoscenza della lingua target (lingua di destinazione), perché eseguono una traduzione letterale che produce frasi prive di senso per un parlante nativo.

Free Translation
traduttore multilingue online. Consente la traduzione di stringhe di testo delle seguenti lingue: inglese, francese, tedesco, spagnolo, italiano, olandese, portoghese, russo. Interfaccia e funzioni di aiuto in lingua inglese e spagnola. Selezionare il pulsante Free Translation dopo aver digitato la stringa da tradurre per ottenere una traduzione gratuita. Servizio disponibile sul sito di SDL International.

Google Translator
il traduttore di Google, disponibile anche con interfaccia in lingua italiana, effettua la traduzione simultanea di vocaboli o di stringhe di testo da/verso piu' di 50 lingue. Per singoli vocaboli o brevi stringhe di testo consente anche la riproduzione sonora della pronuncia della traduzione, limitatamente a 23 lingue. E' attivo anche un servizio di traduzione di documenti testuali caricati da remoto e la traduzione di intere pagine internet delle quali sia digitato l'indirizzo di rete.

Systran
traduttore multilingue online. Consente la traduzione di stringhe di testo fino a 150 caratteri per volta delle seguenti lingue: inglese, francese, tedesco, svedese, portoghese, cinese, giapponese, coreano, russo, arabo. Interfaccia e funzioni di aiuto in lingua inglese. Fornisce anche un servizio di traduzione simultanea, in verità molto imprecisa, di intere pagine web.

Corpora di lingua italiana

Corpora dell'italiano scritto

CORIS/CODIS online
corpus di Italiano Scritto contemporaneo ricco di circa 100 milioni di parole. Elaborato e prodotto dal Centro Interfacoltà di Linguistica Teorica e Applicata (CILTA) "Luigi Heilmann" dell'Universita' di Bologna, prevede una licenza per l'accesso alla versione completa.

Corpus e Lessico di Frequenza dell'Italiano Scritto (CoLFIS)
il corpus di riferimento è costituito da testi tratti da quotidiani del periodo 1992 - 1994 (La Repubblica, La Stampa, Il Corriere della Sera), periodici e libri, considerando anche i libri letti per motivi scolastici o professionali. Consta di 3.150.075 ricorrenze lessicali. Al progetto partecipano i seguenti soggetti: Scuola Normale Superiore (Pisa), Istituto di Scienze e Tecnologie della Cognizione del CNR (Roma), Università di Salerno, Istituto di Linguistica Computazionale, Unità Staccata di Genova del CNR, Università de L'Aquila.

Dizionario italiano multimediale e multilingue d'Ortografia e di Pronunzia della RAI (DOP)
versione online del vocabolario redatto a partire dal 1959 da Bruno Migliorini, Carlo Tagliavini e Piero Fiorelli (riv., agg. e accr. da P. Fiorelli e T. F. Borri) per la sede fiorentina della Radio Televisione Italiana, ora disponibile in versione multimediale. Il corpus, ricco di oltre 92.000 voci di lessico della lingua italiana e oltre 37.000 di una sessantina di lingue diverse, presenta anche la registrazione fonetica delle voci.

MIDIA (Morfologia dell'Italiano in DIAcronia)
corpus di testi scritti in lingua italiana che si estende dall'inizio del XIII alla prima metà del XX secolo. Comprende oltre 7 milioni di occorrenze tratte da circa 800 testi. Realizzato grazie al progetto Prin 2009 "La storia della formazione delle parole in italiano" finanziato dal MIUR, MIDIA offre strumenti di ricerca che permettono agevoli estrazioni di dati, utili in particolare per lo studio della formazione delle parole in italiano dal punto di vista diacronico ma fruibili anche per diverse altre tipologie di indagine linguistica.

la Repubblica Corpus
corpus molto ampio (circa 380mila parole) del lessico del quotidiano la Repubblica. Nel progetto, curato dall'Università di Bologna, il corpus è stato lemmatizzato, taggato e categorizzato per genere e topic; gli articoli nel corpus sono strutturati nelle seguenti parti:titolo, sottotitolo, sommario, testo.

Tesoro della lingua italiana delle origini (TLIO)
versione online del noto vocabolario storico dell'italiano curato dall' Opera del Vocabolario Italiano (OVI), istituto del Consiglio Nazionale delle Ricerche con sede presso l'Accademia della Crusca di Firenze. La versione online, ricca di oltre 12000 voci, si basa sul corpus testuale dell'italiano antico dell'OVI. Questa banca dati testuale offre efficaci strumenti di ricerca, compresa un'interfaccia per il reperimento di voci/forme/redattori/definizioni presenti nel corpus, un database contenente i dati bibliografici degli autori citati, la bibliografia citata nelle voci, ecc.

Corpora dell'italiano parlato

API (Archivio del Parlato Italiano)
progetto coordinato dal prof. Federico Albano Leoni (CIRASS - Napoli) cui hanno partecipato la Scuola Normale Sup. di Pisa, il CIRASS e il Dip. di Neuroscienze dell'Univ. "Federico II" di Napoli, l'Istituto Univ. Orientale di Napoli, il Politecnico di Bari, l'Univ. del Piemonte Orientale, l'Univ. "Ca' Foscari" di Venezia e l'Univ. di Pisa.
Il corpus, raccolto in tre città italiane (Napoli, Bari, Pisa), consiste essenzialmente di dialoghi map task e comprende anche un campione di parlato infantile di bambini sordi e normoudenti.

AVIP-API
progetto coordinato dal prof. Pier Marco Bertinetto (Scuola Normale Sup. - Pisa) cui hanno partecipato la Scuola Normale Sup. di Pisa, il CIRASS e il Dip. di Neuroscienze dell'Univ. "Federico II" di Napoli, l'Istituto Univ. Orientale di Napoli e il Politecnico di Bari. Sostanzialmente contiene lo stesso corpus del progetto API, che ne amplia lo spettro d'indagine, il campione e gli enti partecipanti.

CLIPS (Corpora e Lessici di Italiano Parlato e Scritto)
ampio progetto coordinato dal prof. Federico Albano Leoni (CIRASS - Napoli) cui hanno partecipato l' Univ. "Federico II" di Napoli, la Scuola Normale Sup. di Pisa, la Fondazione Bordoni di Roma, e l' Ist. Sup. Poste e Telecomunicazioni, ora ISCOM. Autori ne sono i proff. F. A. Leoni, F. Cutugno e R Savy.
Pubblicato nel 2006, contiene circa 100 ore di italiano parlato di varie tipologie suddiviso in 5 sottocorpora (radiotelevisivo, dialogico, letto, ortofonico, telefonico). Attraverso un'indagine sociolinguistica preliminare sul territorio italiano, sono state selezionate 15 città dove sono stati raccolti i materiali per la costituzione del corpus.
Accesso diretto al corpus.

Grammo-foni. Le soffitte della voce Gra.fo
Grammo-foni censisce, raccoglie, digitalizza, trascrive materiale sonoro raccolto dagli anni '60 ad oggi da studiosi, appassionati, cultori di dialetti e tradizioni popolari sul territorio toscano. Il progetto è stato condotto dalla Scuola Normale Superiore e dall'Università degli Studi di Siena, finanziato dalla Regione Toscana.

LIP (Lessico di frequenza dell'Italiano Parlato)
il corpus LIP, ospitato sul sito della Banca Dati dell'Italiano Parlato (BaDIP), è la raccolta di testi dell'italiano parlato più importante e più utilizzata nella ricerca linguistica. Costituito nel 1990-1992 da un gruppo di linguisti diretto da Tullio De Mauro, serví per costruire il primo lessico di frequenza dell' italiano parlato. I suoi 469 testi, contenenti complessivamente ca. 490.000 parole, furono raccolti in quattro città (Milano, Firenze, Roma e Napoli) e provengono da cinque macroclassi e numerose sottoclassi di discorso.
Accesso diretto all'interfaccia di ricerca dei lemmi.

Corpora dell'italiano settoriale

Lessico di frequenza dell'Italiano Radiofonico (LIR)
progetto finalizzato alla realizzazione di Lessici di frequenza dell'italiano radiofonico (LIR), coordinato da Nicoletta Maraschio e Stefania Stefanelli presso il Centro di Studi di Grammatica Italiana dell'Accademia della Crusca.
Il progetto prevede che l'intero corpus, trascritto e "in voce" (circa 50 ore di parlato corrispondenti a circa 500.000 occorrenze lessicali), sia allegato al vocabolario su CD-ROM.
Nessuno strumento online e' al momento disponibile.

LinguaGiovani
progetto sul Linguaggio giovanile a cura del Dip.to di Romanistica dell'Univ. degli Studi di Padova e coordinato dal Prof. M. Cortelazzo. Il progetto, che si pone l'obiettivo di coordinare le ricerche sul tema e di raccogliere materiali editi ed inediti, prevede anche la creazione di un dizionario online di termini tratti dal linguaggio giovanile acquisti tramite segnalazioni spontanee online.


Corpora di altre lingue

African Language Lexicon Project
(ALLEX)
il progetto, nato nel 1992 grazie ad una collaborazione tra Università dello Zimbabwe, Gothenburg, Oslo e del Norwegian Documentation Project e facente capo alla Text Encoding Initiative, mette a disposizione corpora delle lingue (parlate e scritte) Ndebele e Shona e relativi dizionari.

British National Corpus (BNC)
Il BNC, sottoinsieme della Bank of English, è una collezione di 100 milioni di parole dell'inglese scritto e parlato ricavato da un'ampia gamma di fonti rappresentative dell'inglese britannico corrente.

BYU Corpus of American English
si dichiara come il più ricco corpus dell'inglese americano libramente disponibile sulla rete. Contiene oltre 360 milioni di parole, con 20 milioni di parole incrementate annualmente negli anni 1990-2007, raccolte dalla lingua parlata, dalla fiction, da riviste, quotidiani e testi accademici ed è sottoposto ad almeno due aggiornamenti all'anno.

Corpus Linguistics
indice di corpora di oltre 20 tra le principali lingue curato dal linguista Michael Barlow.

Gateway to corpus linguistics on the WEB
portale sui corpora curato dalla linguista australiana Yvonne Breyer della Macquarie Unuiversity (Sidney): bibliografie, materiali, strumenti di rete, software per la costruzione di corpora, ecc.
Ampia lista di corpora di oltre 60 lingue: acceddi alla lista alfabetica.

Lexicons of Early Modern English (LEME)
Il Lexicons of Early Modern English è una base di dati storica di dizionari monolingui, bilingui e multilingui, di enciclopedie lessicali, di glossari e trattati linguistici tramandati in forma stampata o manoscritta dalle età Tudor, Stuart, Caroline, Commonwealth, e Restauration. Il progetto, che si articola in una parte liberamente accessibile e in un'altra a pagamento, è curato da University of Toronto.

Linguistic data consortium corpora catalogue
catalogo di corpora di centinaia di lingue curato dal Linguistic Data Consortium (LDC)
Dispone di raffinati strumenti di ricerca (per tipo e fonte ; per anno di produzione, etc.)

Intratext
questo sito, eccellente base di partenza per la costruzione di corpora testuali, propone moltissimi materiali, prevalentemente di libero accesso. I testi sono sovente etichettati e glossati e talvolta dispone anche di indici alfabetici, inversi e di frequenza

Thesaurus Indogermanischer Text- und Sprachmaterialen (TITUS)
sito bilingue (tedesco-inglese) di riferimento che ospita i corpora di una cinquantina di lingue indoeurope e relative varianti. E' un progetto curato dal Dipartimento di L. comparativa dell'Universita' di Francoforte. I database linguistici possono essere consultati utilizzando varie modalita' di ricerca:
ricerca generica
ricerca per termini esatti (consente di selezionare la lingua e relative varianti)
ricerca "sui database" (idem c.s. ma fornice anche la possibilita' di estendere o meno la ricerca anche alle varianti grafiche e grammaticali del termine immesso)

WebCONC
database di concordanze rilevate sull'intera rete Internet analizzata come un unico corpus ; progetto curato da Matthias Huning del Dip.to di Filologia Nederlandese della Libera Univ. di Berlino

Enti
American National Corpus
Centre for English Corpus Linguistics presso la Université catholique de Louvain (Belgium)

[pagina creata: 19-04-2005 - ultima modifica: 20-06-2017]