Risorse Internet per la Linguistica. Dizionari online e corpora linguistici
dizionari online monolingua |
dizionari bilingue e multilingue | traduttori automatici |
corpora di lingua italiana |
corpora di altre lingue |
enti
Dizionari monolingua
Francese
Dictionnaire de l'Academie Française
versione online parziale
(primi due tomi, dalla lettera "A" ad "Negaton") della 9. ed.; sito ottimizzato
per Explorer 6.0 e sup. (non compatibile per Netscape Navigator); accesso
diretto all'interfaccia
di ricerca
Le Trésor de la Langue Française
informatisé
versione online del dizionario storico pubblicato in 16 volumi da Gallimard sulla lingua dei
secoli XIX e XX ; servizio curato da ATILF, CNRS e Universitè de Nancy
Inglese
Merriam-Webster online
versione online della 10. edizione
a stampa del celebre dizionario completo di definizioni, pronuncia, etim.
e uso dei lemmi; è disponibile anche un thesaurus
Middle English Dictionary
dizionario online dell'inglese medievale (1100-1500), basato sull'analisi di una collezione di oltre 3 milioni di citazioni. Questo dizionario, che contiene integralmente la corrispondente vers. a stampa, fa parte di Middle English Compendium, progetto digitale curato da Michigan University Library e Michigan University Press che presenta una serie di strumenti utili per lo studio dell'inglese m.evale (corpora, bibliografie, cataloghi di ms, ecc).
Italiano
Dizionario online Hoepli
dizionario tratto da: Grande dizionario italiano con CD-ROM / di Aldo Gabrielli
DOP: Dizionario italiano multimediale e multilingue d'Ortografia e Pronunzia
il DOP, redatto in origine da Bruno Migliorini, Carlo Tagliavini e Pietro Fiorelli, si presenta qui in una versione multimediale, sotto l'egida della RAI, riveduto aggiornato e accresciuto da Pietro Fiorelli e Tommaso Francesco Borri. Per maggiori informazioni vedi la guida.
Portoghese
Lingua Portuguesa Online
dizionario ricco di circa 100.000 termini, 13.000 congiugazioni di verbi, riconoscimento delle
forme flesse e grammatica online; curato da Priberam Informatica
Spagnolo
Diccionarios.com
fornisce anche
la traduzione di lemmi dallo spagnolo all'inglese, tedesco, francese e catalano
e viceversa; curato dal gruppo editoriale Anaya
Tedesco
Das Deutsche Wörterbuch von Jacob und Wilhelm Grimm im Internet
versione online 2.0 (2003) del dizionario storico monolingua del tedesco, iniziato dai fratelli Grimm e pubblicato in 16 volumi a stampa dall'editore Hirzel di Lipsia dal 1854 al 1960.
Dall'interfaccia di ricerca è possibile ricercare i lemmi, individuare le citazioni di un termine nell'intero dizionario o scorrere il dizionario in modo sequenziale.
Progetto digitale realizzato da Universität Trier in collaborazione con Akademie der Wissenschaften und der Literatur, Mainz, sotto il patrocinio del Ministero della Cultura tedesco.
Das Goethe-Wörterbuch im Internet
versione online del dizionario storico della lingua di Goethe, nell'ed. 1978-1999 curata da Berlin-Brandenburgischen Akademie der Wissenschaften, Deutsche Akademie der Wissenschaften zu Berlin, Akademie der Wissenschaften der DDR, Akademie der Wissenschaften in Göttingen e Heidelberger Akademie der Wissenschaften.
Accesso diretto all'interfaccia di ricerca dei lemmi.
Progetto digitale realizzato da Kompetenzzentrums für elektronische Erschliessungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier in collaborazione con Interakademischen Kommission für das Goethe-Wörterbuch.
Wortschatz Lexikon
dizionario corrente online della lingua tedesca. Progetto curato dall'Università di Lipsia.
Dizionari bilingue e multilingue
Free Online Dictionary
servizio di traduzione reciproca dall'inglese in 16 diverse lingue, comprese alcune poco diffuse (swahili, norvegese, giapponese,
indonesiano, afrikaans)
From language to language
dizionario multilingue online; fornisce un servizio di traduzione relativo alle più diffuse lingue occidentali e slave; traduzione anche per l'esperanto e lo swahili.
Lexicool.com
il sito si dichiara un "repertorio di dizionari bilingui e plurilingui" ed effettivamente si configura come uno dei principali servizi di ricognizione di strumenti di questo genere disponibili online, avendone censiti oltre 4mila. L'interfaccia di ricerca disponibile sulla home page non traduce direttamente i termini ma fornisce una lista di strumenti di traduzione disponibili online per l'analisi delle lingue definite nei criteri di scelta.
Logos multilingual E-Translation
Portal
questo sito mette a disposizione dizionari monolingue, bilingue e multilingue oltre a descrizioni grammaticali di sistemi linguistici molto diversi tra loro, in prospettiva sia tipologica che genetica. Il sito, curato da Logos, puo' rappresentare un valido strumento per una prima ricognizione sulle peculiarita' morofosintattiche di una lingua.
WordReference
dizionario di traduzione multilingue (inglese, francese, spagnolo, italiano). Il dizionario italiano-inglese, in grado di tradurre solo singole parole o frasi molto brevi, comprende circa 100.000 lemmi con più di 250.000 traduzioni ed è in continua crescita. E' corredato da un dizionario monolingue inglese.
Your dictionary.com
ricchissimo meta-indice lessicale che presenta repertori di dizionari mono- e bi-lingui, glossari e corsi di apprendimento relativi ad oltre 200 lingue.
Traduttori automatici
avvertenza: i traduttori automatici possono essere di qualche aiuto solo nel caso in cui già si abbia una buona conoscenza della lingua target (lingua di destinazione), perché eseguono una traduzione letterale che produce frasi prive di senso per un parlante nativo.
Babel Fish Translation
traduttore multilingue online. Consente la traduzione di stringhe di testo fino a 150 caratteri per volta delle seguenti lingue: inglese, francese, spagnolo, olandese, italiano, neo-greco, portoghese, cinese, giapponese, coreano, russo. Interfaccia e funzioni di aiuto in lingua italiana. Servizio disponibile sul sito di Altavista.
Systran
traduttore multilingue online. Consente la traduzione di stringhe di testo fino a 150 caratteri per volta delle seguenti lingue: inglese, francese, tedesco, svedese, portoghese, cinese, giapponese, coreano, russo, arabo. Interfaccia e funzioni di aiuto in lingua inglese. Fornisce anche un servizio di traduzione simultanea, in verità molto imprecisa, di intere pagine web.
Free Translation
traduttore multilingue online. Consente la traduzione di stringhe di testo delle seguenti lingue: inglese, francese, tedesco, spagnolo, italiano, olandese, portoghese, russo. Interfaccia e funzioni di aiuto in lingua inglese e spagnola. Selezionare il pulsante Free Translation dopo aver digitato la stringa da tradurre per ottenere una traduzione gratuita. Servizio disponibile sul sito di SDL International.
Corpora di lingua italiana
Corpora dell'italiano scritto
CORIS/CODIS online
corpus di Italiano Scritto contemporaneo ricco di circa
100 milioni di parole. Elaborato e prodotto dal
Centro Interfacoltà di
Linguistica Teorica e Applicata (CILTA) "Luigi
Heilmann" dell'Universita' di Bologna, prevede una licenza per
l'accesso alla versione completa. E' invece disponibile gratuitamente
online una versione demo limitata ad un
corpus di circa 150.000 parole
Corpus e Lessico di Frequenza dell'Italiano Scritto (CoLFIS)
il corpus di riferimento è costituito da testi tratti da quotidiani del periodo 1992 - 1994 (La Repubblica, La Stampa, Il Corriere della Sera), periodici e libri, considerando anche i libri letti per motivi scolastici o professionali. Consta di 3.150.075 ricorrenze lessicali. Al progetto partecipano i seguenti soggetti: Scuola Normale Superiore (Pisa), Istituto di Scienze e Tecnologie della Cognizione del CNR (Roma),
Università di Salerno, Istituto di Linguistica Computazionale, Unità Staccata di Genova del CNR, Università de L'Aquila.
Pagina di presentazione del progetto ospitata sul sito del Laboratorio di Linguistica della Scuola Normale Sup. di Pisa.
Strumenti online disponibili: corpus non lemmatizzato; corpus lemmatizzato; lessico di frequenza.
Dizionario italiano multimediale e multilingue d'Ortografia e di Pronunzia della RAI (DOP)
versione online del vocabolario redatto a partire dal 1959 da Bruno Migliorini, Carlo Tagliavini e Piero Fiorelli (riv., agg. e accr. da P. Fiorelli e T. F. Borri) per la sede fiorentina della Radio Televisione Italiana, ora disponibile in versione multimediale. Il corpus, ricco di oltre 92.000 voci di lessico della lingua italiana e oltre 37.000 di una sessantina di lingue diverse, presenta anche la registrazione fonetica delle voci.
Tesoro della lingua italiana
delle origini (TLIO)
versione online del noto vocabolario storico dell'italiano
curato dall' Opera del Vocabolario Italiano (OVI), istituto del
Consiglio Nazionale delle Ricerche con sede
presso l'Accademia della
Crusca di Firenze.
La versione online, ricca di
oltre 12000 voci, si basa sul corpus testuale dell'italiano antico
dell'OVI. Questa banca dati testuale offre efficaci strumenti di ricerca,
compresa un'interfaccia per il reperimento di voci/forme/redattori/definizioni
presenti nel corpus, un database contenente i dati bibliografici
degli autori citati, la bibliografia citata nelle voci, ecc.
Corpora dell'italiano parlato
API (Archivio del Parlato Italiano)
progetto coordinato dal prof. Federico Albano Leoni (CIRASS - Napoli) cui hanno partecipato la Scuola Normale Sup. di Pisa, il CIRASS e il Dip. di Neuroscienze dell’Univ. “Federico II” di Napoli, l’Istituto Univ. Orientale di Napoli, il Politecnico di Bari, l’Univ. del Piemonte Orientale,
l’Univ. “Ca’ Foscari” di Venezia e l’Univ. di Pisa.
Il corpus, raccolto in tre città italiane (Napoli, Bari, Pisa), consiste essenzialmente di dialoghi map task e comprende anche un campione di parlato infantile di bambini sordi e normoudenti. L’interfaccia di ricerca sul corpus è disponibile sul sito Parlaritaliano.it.
AVIP-API
progetto coordinato dal prof. Pier Marco Bertinetto (Scuola Normale Sup. - Pisa) cui hanno partecipato la Scuola Normale Sup. di Pisa, il CIRASS e il Dip. di Neuroscienze dell’Univ. “Federico II” di Napoli, l’Istituto Univ. Orientale di Napoli e il Politecnico di Bari.
Sostanzialmente contiene lo stesso corpus del progetto API, che ne amplia lo spettro d’indagine, il campione e gli enti partecipanti.
CLIPS (Corpora e Lessici di Italiano Parlato e Scritto)
ampio progetto coordinato dal prof. Federico Albano Leoni (CIRASS - Napoli) cui hanno partecipato l’ Univ. “Federico II” di Napoli, la Scuola Normale Sup. di Pisa, la Fondazione Bordoni di Roma, e l’ Ist. Sup. Poste e Telecomunicazioni, ora ISCOM. Autori ne sono i proff. F. A. Leoni, F. Cutugno e R Savy.
Pubblicato nel 2006, contiene circa 100 ore di italiano parlato di varie tipologie suddiviso in 5 sottocorpora (radiotelevisivo, dialogico, letto, ortofonico, telefonico). Attraverso un'indagine sociolinguistica preliminare sul territorio italiano, sono state selezionate 15 città dove sono stati raccolti i materiali per la costituzione del corpus.
Accesso diretto al corpus.
LIP (Lessico di frequenza dell'Italiano Parlato)
il corpus LIP, ospitato sul sito della Banca Dati dell'Italiano Parlato (BaDIP), è la raccolta di testi dell'italiano parlato più importante e più utilizzata nella ricerca linguistica. Costituito nel 1990-1992 da un gruppo di linguisti diretto da Tullio De Mauro, serví per costruire il primo lessico di frequenza dell' italiano parlato. I suoi 469 testi, contenenti complessivamente ca. 490.000 parole, furono raccolti in quattro città (Milano, Firenze, Roma e Napoli) e provengono da cinque macroclassi e numerose sottoclassi di discorso.
Accesso diretto all'interfaccia di ricerca dei lemmi.
Corpora dell'italiano settoriale
Corpus di Italiano Televisivo (CIT)
raccolta di testi trascritti in formato elettronico da trasmissioni televisive, mirata all'analisi delle caratteristiche lessicali e grammaticali dell'italiano trasmesso in televisione. Il progetto ha sede presso il Dipartimento di Scienze del Linguaggio dell'Università per Stranieri di Perugia ha avuto inizio nell'agosto 1998.
Lessico di frequenza dell'Italiano Radiofonico (LIR)
progetto finalizzato alla realizzazione di Lessici di frequenza dell'italiano radiofonico (LIR), coordinato da Nicoletta Maraschio e Stefania Stefanelli presso il Centro di Studi di Grammatica Italiana dell'Accademia della Crusca.
Il progetto prevede che l'intero corpus, trascritto e "in voce" (circa 50 ore di parlato corrispondenti a circa 500.000 occorrenze lessicali), sia allegato al vocabolario su CD-ROM.
Nessuno strumento online e' al momento disponibile.
LinguaGiovani
progetto sul Linguaggio giovanile a cura del Dip.to di Romanistica dell'Univ. degli Studi di Padova e coordinato dal Prof. M. Cortelazzo. Il progetto, che si pone l'obiettivo di coordinare le ricerche sul tema e di raccogliere materiali editi ed inediti, prevede anche la creazione di un dizionario online di termini tratti dal linguaggio giovanile acquisti tramite segnalazioni spontanee online.
Repertori di corpora italiani
Parlaritialiano. Corpora
repertorio di corpora dell’italiano parlato ospitato dall’Università di Salerno. Le schede descrivono le caratteristiche e le aree tematiche dei progetti di indagine e forniscono l’accesso diretto ai corpora.
Repertorio delle Banche Dati dell'Italiano Parlato
censimento dei corpora più importanti dell'italiano parlato che sono stati raccolti e pubblicati dal 1965 in poi. Il repertorio e' ospitato su un sito gratuito dedicato alla pubblicazione di corpora e altri materiali per l'analisi e lo studio dell'italiano parlato che fa parte del Language Server della Karl-Franzens-Universität Graz (Austria).
Corpora di altre lingue
African Language Lexicon Project
(ALLEX)
il progetto, nato nel 1992 grazie ad una collaborazione
tra Università dello Zimbabwe, Gothenburg, Oslo e del Norwegian
Documentation Project e facente capo alla Text Encoding Initiative,
mette a disposizione corpora delle lingue (parlate e scritte) Ndebele
e Shona e relativi dizionari.
BYU Corpus of American English
si dichiara come il più ricco corpus dell'inglese americano libramente disponibile sulla rete. Contiene oltre 360 milioni di parole, con 20 milioni di parole incrementate annualmente negli anni 1990-2007, raccolte dalla lingua parlata, dalla fiction, da riviste, quotidiani e testi accademici ed è sottoposto ad almeno due aggiornamenti all'anno.
Corpus Linguistics
indice di corpora di oltre 20 tra le principali lingue curato
dal linguista Michael Barlow.
Gateway to corpus linguistics on the WEB
portale sui corpora curato dalla linguista australiana Yvonne Breyer della Macquarie Unuiversity (Sidney): bibliografie, materiali, strumenti di rete, software per la costruzione di corpora, ecc.
Ampia lista di corpora di oltre 60 lingue: acceddi alla lista alfabetica.
Linguistic data consortium corpora catalogue
catalogo di corpora di centinaia di lingue curato dal
Linguistic Data Consortium (LDC)
Dispone di raffinati
strumenti di ricerca (per tipo e fonte ; per anno di produzione,
etc.)
Intratext
questo sito, eccellente base di partenza per la costruzione
di corpora testuali, propone moltissimi materiali, prevalentemente
di libero accesso. I testi sono sovente etichettati e glossati
e talvolta dispone anche di indici alfabetici, inversi e di frequenza
Thesaurus Indogermanischer Text- und Sprachmaterialen (TITUS)
sito bilingue (tedesco-inglese) di riferimento
che ospita i corpora di una cinquantina di lingue indoeurope e relative
varianti. E' un progetto curato dal Dipartimento di L. comparativa
dell'Universita' di Francoforte. I database linguistici possono essere
consultati utilizzando varie modalita' di ricerca:
ricerca generica
ricerca per termini esatti
(consente di selezionare la lingua e relative varianti)
ricerca "sui database" (idem
c.s. ma fornice anche la possibilita' di estendere o meno la ricerca
anche alle varianti grafiche e grammaticali del termine immesso)
WebCONC
database di concordanze rilevate sull'intera rete Internet analizzata
come un unico corpus ; progetto curato da Matthias Huning del
Dip.to di Filologia Nederlandese
della Libera Univ. di Berlino
Enti
American National Corpus
Centre for English Corpus Linguistics
presso la Université catholique de Louvain (Belgium)
ultimo aggiornamento di questa pagina 2009-10-12
|
 |
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
|
|
 |
| | Info e segnalazioni:
Marco Tomassini
Linguistica
tel. +39 050509352
email: m.tomassini@sns.it
|
|