Viene presentata la banca dati dell'italiano antico allestita presso l'Opera del Vocabolario Italiano, il "Corpus TLIO", l'insieme di testi italoromanzi editi sui quali viene redatto il Tesoro della Lingua Italiana delle Origini. Ne viene tracciata la storia, illustrando le modalità di scelta di testi e di edizioni e la preparazione dei testi, generalmente con il controllo dei manoscritti, operata da parte dell'Ufficio filologico dell'OVI (1965-85), per arrivare fino al modus operandi di oggi, che comprende anche l'attribuzione del cosiddetto 'indice di qualità' linguistica del testo. Vengono esposti i nuovi criteri di lemmatizzazione per il Corpus TLIO, criteri che si discostano da quelli enunciati nella "Grammatichetta della lingua italiana ad uso del calcolatore" di Piero Esperti; i nuovi criteri sono dettati sia da esigenze informatiche, in previsione dello sviluppo di un nuovo software, GATTO 4, che prevede un lemmatizzatore automatico, sia dall'esperienza di redazione.

Il punto sui corpora dell'Opera del Vocabolario Italiano

Artale Elena
2012

Abstract

Viene presentata la banca dati dell'italiano antico allestita presso l'Opera del Vocabolario Italiano, il "Corpus TLIO", l'insieme di testi italoromanzi editi sui quali viene redatto il Tesoro della Lingua Italiana delle Origini. Ne viene tracciata la storia, illustrando le modalità di scelta di testi e di edizioni e la preparazione dei testi, generalmente con il controllo dei manoscritti, operata da parte dell'Ufficio filologico dell'OVI (1965-85), per arrivare fino al modus operandi di oggi, che comprende anche l'attribuzione del cosiddetto 'indice di qualità' linguistica del testo. Vengono esposti i nuovi criteri di lemmatizzazione per il Corpus TLIO, criteri che si discostano da quelli enunciati nella "Grammatichetta della lingua italiana ad uso del calcolatore" di Piero Esperti; i nuovi criteri sono dettati sia da esigenze informatiche, in previsione dello sviluppo di un nuovo software, GATTO 4, che prevede un lemmatizzatore automatico, sia dall'esperienza di redazione.
2012
Istituto Opera del Vocabolario Italiano - OVI
978-88-6274-370-9
Lessicografia italiana
Italiano antico
Banche dati testuali
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/18986
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact