Il Corpus OVI dell'Italiano antico è (insieme con il vocabolario) il prodotto dell'attività istituzionale dell'Istituto, corrispondente alla missione del vocabolario storico italiano; sono indicati come autori i responsabili del corpus (Pär Larson) e della lemmatizzazione (Elena Artale) nel 2012. È la banca dati costruita dall'OVI in funzione del Tesoro della Lingua Italiana delle Origini (TLIO), resa disponibile agli studiosi in Internet dal 1998. E' implementata in GATTO e interrogabile via web in GattoWeb (http://gattoweb.ovi.cnr.it), due software dell'Istituto. Nella versione 2012 contiene 2320 testi, scritti in qualunque varietà del sistema linguistico italiano entro la fine del Trecento (con qualche sconfinamento), per 23.208.998 parole (occorrenze). Comprende il Corpus TLIO e il Corpus TLIO aggiuntivo, che sono consultabili anche separatamente (http://tlioweb.ovi.cnr.it e http://aggweb.ovi.cnr.it). Il Corpus TLIO è il corpus di riferimento del TLIO, ed è lemmatizzato: sono associate ad un lemma tutte le forme grafiche (con un minimo residuo di circa 2000 forme non interpretate su 444.266 forme diverse), e sono lemmatizzate esplicitamente le occorrenze in 3.650.076 contesti. La banca dati nel suo insieme è attualmente riconosciuta dagli studiosi come il più potente strumento di conoscenza dell'italiano antico in tutte le sue varietà.

Corpus OVI dell'Italiano antico - Versione 2012

Larson;Elena
2012

Abstract

Il Corpus OVI dell'Italiano antico è (insieme con il vocabolario) il prodotto dell'attività istituzionale dell'Istituto, corrispondente alla missione del vocabolario storico italiano; sono indicati come autori i responsabili del corpus (Pär Larson) e della lemmatizzazione (Elena Artale) nel 2012. È la banca dati costruita dall'OVI in funzione del Tesoro della Lingua Italiana delle Origini (TLIO), resa disponibile agli studiosi in Internet dal 1998. E' implementata in GATTO e interrogabile via web in GattoWeb (http://gattoweb.ovi.cnr.it), due software dell'Istituto. Nella versione 2012 contiene 2320 testi, scritti in qualunque varietà del sistema linguistico italiano entro la fine del Trecento (con qualche sconfinamento), per 23.208.998 parole (occorrenze). Comprende il Corpus TLIO e il Corpus TLIO aggiuntivo, che sono consultabili anche separatamente (http://tlioweb.ovi.cnr.it e http://aggweb.ovi.cnr.it). Il Corpus TLIO è il corpus di riferimento del TLIO, ed è lemmatizzato: sono associate ad un lemma tutte le forme grafiche (con un minimo residuo di circa 2000 forme non interpretate su 444.266 forme diverse), e sono lemmatizzate esplicitamente le occorrenze in 3.650.076 contesti. La banca dati nel suo insieme è attualmente riconosciuta dagli studiosi come il più potente strumento di conoscenza dell'italiano antico in tutte le sue varietà.
2012
Istituto Opera del Vocabolario Italiano - OVI
Lessicografia italiana
Italiano antico
Banche dati testuali
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/19053
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact