Il Corpus DiVo è parte del progetto di ricerca DiVo - Dizionario dei Volgarizzamenti diretto da Elisa Guadagnini e Giulio Vaccaro, ospitato dall'Istituto Opera del Vocabolario Italiano (CNR) e dalla Scuola Normale Superiore di Pisa, finanziato dal MIUR all'interno del programma FIRB - Futuro in Ricerca 2010. Il Corpus DiVo, interrogabile con GattoWeb, è curato da Cosimo Burgassi, Diego Dotto, Elisa Guadagnini e Giulio Vaccaro. Comprende attualmente 165 testi volgari, per complessive 6.374.624 occorrenze di 177.340 forme grafiche distinte. Sono presenti 86 testi latini associati. Sono presenti nel corpus due distinti specimina di lemmatizzazione e iperlemmatizzazione, entrambi a cura di Diego Dotto: il primo, fondato su un sottocorpus, segue i criteri descritti in D. Dotto, Note per la lemmatizzazione del corpus DiVo, in «Bollettino dell'Opera del Vocabolario Italiano», XVII (2012), pp. 336-364; il secondo, fondato sull'intero corpus, seleziona alcuni lemmi significativi con riferimento agli iperlemmi «Cariche e uffici» e «Vestiario» (per questi lemmi un sistema di etichettatura isola le dittologie sinonimiche, marcate «] Ditt.», e gli esempi con valore di glossa, marcati «] Gl»). Per la consultazione, occorre accedere alla «Ricerca di contesti per iperlemmi», in cui si potranno interrogare i 13 iperlemmi individuati che mettono in relazione i lemmi per area semantica, o alla «Ricerca di contesti per disambiguatori», dove ricercando le stringhe «] Ditt.» e «] Gl» si potranno recuperare tutti i contesti che presentano la suddetta marcatura. Sono presenti 2.427 lemmi, per un totale di 51.274 occorrenze lemmatizzate.
Corpus del Dizionario dei Volgarizzamenti (Corpus DiVo) (2014)
Cosimo Burgassi;Diego Dotto;Elisa Guadagnini;Giulio Vaccaro
2014
Abstract
Il Corpus DiVo è parte del progetto di ricerca DiVo - Dizionario dei Volgarizzamenti diretto da Elisa Guadagnini e Giulio Vaccaro, ospitato dall'Istituto Opera del Vocabolario Italiano (CNR) e dalla Scuola Normale Superiore di Pisa, finanziato dal MIUR all'interno del programma FIRB - Futuro in Ricerca 2010. Il Corpus DiVo, interrogabile con GattoWeb, è curato da Cosimo Burgassi, Diego Dotto, Elisa Guadagnini e Giulio Vaccaro. Comprende attualmente 165 testi volgari, per complessive 6.374.624 occorrenze di 177.340 forme grafiche distinte. Sono presenti 86 testi latini associati. Sono presenti nel corpus due distinti specimina di lemmatizzazione e iperlemmatizzazione, entrambi a cura di Diego Dotto: il primo, fondato su un sottocorpus, segue i criteri descritti in D. Dotto, Note per la lemmatizzazione del corpus DiVo, in «Bollettino dell'Opera del Vocabolario Italiano», XVII (2012), pp. 336-364; il secondo, fondato sull'intero corpus, seleziona alcuni lemmi significativi con riferimento agli iperlemmi «Cariche e uffici» e «Vestiario» (per questi lemmi un sistema di etichettatura isola le dittologie sinonimiche, marcate «] Ditt.», e gli esempi con valore di glossa, marcati «] Gl»). Per la consultazione, occorre accedere alla «Ricerca di contesti per iperlemmi», in cui si potranno interrogare i 13 iperlemmi individuati che mettono in relazione i lemmi per area semantica, o alla «Ricerca di contesti per disambiguatori», dove ricercando le stringhe «] Ditt.» e «] Gl» si potranno recuperare tutti i contesti che presentano la suddetta marcatura. Sono presenti 2.427 lemmi, per un totale di 51.274 occorrenze lemmatizzate.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.