Viene presentata la banca dati dell'italiano antico allestita presso l'Opera del Vocabolario Italiano, il "Corpus TLIO", l'insieme di testi italoromanzi editi sui quali viene redatto il Tesoro della Lingua Italiana delle Origini. Ne viene tracciata la storia, illustrando le modalità di scelta di testi e di edizioni e la preparazione dei testi, generalmente con il controllo dei manoscritti, operata da parte dell'Ufficio filologico dell'OVI (1965-85), per arrivare fino al modus operandi di oggi, che comprende anche l'attribuzione del cosiddetto 'indice di qualità' linguistica del testo. Vengono esposti i nuovi criteri di lemmatizzazione per il Corpus TLIO, criteri che si discostano da quelli enunciati nella "Grammatichetta della lingua italiana ad uso del calcolatore" di Piero Esperti; i nuovi criteri sono dettati sia da esigenze informatiche, in previsione dello sviluppo di un nuovo software, GATTO 4, che prevede un lemmatizzatore automatico, sia dall'esperienza di redazione.

Il punto sui corpora dell'Opera del Vocabolario Italiano

Larson Pär;Artale Elena
2012

Abstract

Viene presentata la banca dati dell'italiano antico allestita presso l'Opera del Vocabolario Italiano, il "Corpus TLIO", l'insieme di testi italoromanzi editi sui quali viene redatto il Tesoro della Lingua Italiana delle Origini. Ne viene tracciata la storia, illustrando le modalità di scelta di testi e di edizioni e la preparazione dei testi, generalmente con il controllo dei manoscritti, operata da parte dell'Ufficio filologico dell'OVI (1965-85), per arrivare fino al modus operandi di oggi, che comprende anche l'attribuzione del cosiddetto 'indice di qualità' linguistica del testo. Vengono esposti i nuovi criteri di lemmatizzazione per il Corpus TLIO, criteri che si discostano da quelli enunciati nella "Grammatichetta della lingua italiana ad uso del calcolatore" di Piero Esperti; i nuovi criteri sono dettati sia da esigenze informatiche, in previsione dello sviluppo di un nuovo software, GATTO 4, che prevede un lemmatizzatore automatico, sia dall'esperienza di redazione.
2012
Istituto Opera del Vocabolario Italiano - OVI
Italiano
Dizionari e ricerca filologica. Atti della Giornata di Studi in memoria di Valentina Pollidori
Dizionari e ricerca filologica. Giornata di Studi in memoria di Valentina Pollidori
25
40
16
978-88-6274-370-9
Edizioni dell'Orso
Alessandria
ITALIA
26 ottobre 2010
Firenze
Lessicografia italiana
Italiano antico
Banche dati testuali
I paragrafi 1-10 (pp. 25-32) sono di Pär Larson, "I paragrafi 11-13 (pp. 32-40) sono di Elena Artale.
2
none
Larson, Pär; Artale, Elena
273
info:eu-repo/semantics/conferenceObject
04 Contributo in convegno::04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/18986
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact