Il Corpus OVI dell'Italiano antico è (insieme con il vocabolario) il prodotto dell'attività istituzionale dell'Istituto, corrispondente alla missione del vocabolario storico italiano; sono indicati come autori i responsabili del corpus (Pär Larson) e della lemmatizzazione (Elena Artale) nel 2016. È la banca dati costruita dall'OVI in funzione del Tesoro della Lingua Italiana delle Origini (TLIO), resa disponibile agli studiosi in Internet dal 1998. E' implementata in GATTO e interrogabile via web in GattoWeb (http://gattoweb.ovi.cnr.it), due software dell'Istituto. Nella versione 2016 contiene 2335 testi, scritti in qualunque varietà del sistema linguistico italiano entro la fine del Trecento (con qualche sconfinamento), per 23.176.174 parole (occorrenze). Comprende il Corpus TLIO e il Corpus TLIO aggiuntivo, che sono consultabili anche separatamente (http://tlioweb.ovi.cnr.it e http://aggweb.ovi.cnr.it). Il Corpus TLIO è il corpus di riferimento del TLIO, ed è lemmatizzato: sono associate ad un lemma tutte le forme grafiche e sono lemmatizzate esplicitamente le occorrenze in 3.674.650 contesti. La banca dati nel suo insieme è attualmente riconosciuta dagli studiosi come il più potente strumento di conoscenza dell'italiano antico in tutte le sue varietà.
Corpus OVI dell'Italiano antico - Versione 2016
Artale Elena
2016
Abstract
Il Corpus OVI dell'Italiano antico è (insieme con il vocabolario) il prodotto dell'attività istituzionale dell'Istituto, corrispondente alla missione del vocabolario storico italiano; sono indicati come autori i responsabili del corpus (Pär Larson) e della lemmatizzazione (Elena Artale) nel 2016. È la banca dati costruita dall'OVI in funzione del Tesoro della Lingua Italiana delle Origini (TLIO), resa disponibile agli studiosi in Internet dal 1998. E' implementata in GATTO e interrogabile via web in GattoWeb (http://gattoweb.ovi.cnr.it), due software dell'Istituto. Nella versione 2016 contiene 2335 testi, scritti in qualunque varietà del sistema linguistico italiano entro la fine del Trecento (con qualche sconfinamento), per 23.176.174 parole (occorrenze). Comprende il Corpus TLIO e il Corpus TLIO aggiuntivo, che sono consultabili anche separatamente (http://tlioweb.ovi.cnr.it e http://aggweb.ovi.cnr.it). Il Corpus TLIO è il corpus di riferimento del TLIO, ed è lemmatizzato: sono associate ad un lemma tutte le forme grafiche e sono lemmatizzate esplicitamente le occorrenze in 3.674.650 contesti. La banca dati nel suo insieme è attualmente riconosciuta dagli studiosi come il più potente strumento di conoscenza dell'italiano antico in tutte le sue varietà.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.