Preserving Preserving and enhancing cultural heritage: the Digest project

Cinini, Alessandra; Marongiu, Paola; Sassolini, Eva; Monachini, Monica

doi:10.6092/unibo/amsacta/8380

This paper aims to describe and analyze the activities related to the preservation and valorization of textual corpora of cultural-historical value, produced over a long period of time. We intend to share with the scientific community the problems related to the advancement of technologies used for data creation/processing, as well as the issues related to the transition from proprietary to standard formats to enable data sharing and interoperability. Finally, we will outline the complex transition to open data paradigms and the necessary steps for migrating data into international research infrastructures. Specifically, we will describe the translation process of Justinian’s Digest, emphasizing how this has evolved alongside technological progress. Our contribution will offer the DH community a point of view on the evolution of the digitization/computerization of large textual resources, based on a real use-case. To illustrate this, we will examine how specialized translation from Latin to Italian can be enhanced using textual analysis tools. Furthermore, we will describe the transformation of both the original and translated texts into a parallel bilingual corpus; its conversion into XML TEI format; the steps taken for depositing the data in the CLARIN research infrastructure.

Valorizzare e custodire il patrimonio culturale: alla scoperta del progetto Digesto. Il contributo vuole discutere delle attivita connesse alla salvaguardia e alla valorizzazione di corpora testuali di valore storicoculturale prodotti in un lungo arco temporale. Analizzeremo le problematiche legate al progresso delle tecnologie utilizzate per la creazione/elaborazione dei dati che sono mutate nel tempo, nonche l'arduo passaggio dai formati proprietari a quelli standard per una migliore condivisione e interoperabilita dei dati. Infine, descriveremo la non facile transizione verso paradigmi di dati aperti e i passaggi necessari per migrare i dati verso infrastrutture di ricerca internazionali. In particolare, descriveremo le fasi del progetto di traduzione del Digesto di Giustiniano che hanno richiesto il supporto tecnologico del nostro gruppo di ricerca, e come questo contributo e cambiato di pari passo con il progresso tecnologico. Vogliamo offrire alla comunita DH un punto di vista reale sull'evoluzione della digitalizzazione/informatizzazione di grandi risorse testuali. Nel caso specifico, discuteremo del supporto alla traduzione specializzata dal latino all'italiano con strumenti di analisi testuale, e della trasformazione dei testi originali e tradotti in un corpus bilingue parallelo; di come questo e stato convertito in formato XML TEI; infine, delle operazioni necessarie al deposito dei dati all'interno dell'infrastruttura di ricerca CLARIN.

Preserving Preserving and enhancing cultural heritage: the Digest project

Alessandra Cinini;Paola Marongiu;Eva Sassolini;Monica Monachini

2025

Abstract

This paper aims to describe and analyze the activities related to the preservation and valorization of textual corpora of cultural-historical value, produced over a long period of time. We intend to share with the scientific community the problems related to the advancement of technologies used for data creation/processing, as well as the issues related to the transition from proprietary to standard formats to enable data sharing and interoperability. Finally, we will outline the complex transition to open data paradigms and the necessary steps for migrating data into international research infrastructures. Specifically, we will describe the translation process of Justinian’s Digest, emphasizing how this has evolved alongside technological progress. Our contribution will offer the DH community a point of view on the evolution of the digitization/computerization of large textual resources, based on a real use-case. To illustrate this, we will examine how specialized translation from Latin to Italian can be enhanced using textual analysis tools. Furthermore, we will describe the transformation of both the original and translated texts into a parallel bilingual corpus; its conversion into XML TEI format; the steps taken for depositing the data in the CLARIN research infrastructure.

Scheda breve

Scheda completa

Scheda completa (DC)

Campo DC	Valore	Lingua
dc.authority.orgunit	Istituto di linguistica computazionale "Antonio Zampolli" - ILC	en
dc.authority.people	Alessandra Cinini	en
dc.authority.people	Paola Marongiu	en
dc.authority.people	Eva Sassolini	en
dc.authority.people	Monica Monachini	en
dc.authority.project	CUP B53D23032480001	en
dc.collection.id.s	71c7200a-7c5f-4e83-8d57-d3d2ba88f40d	*
dc.collection.name	04.01 Contributo in Atti di convegno	*
dc.contributor.appartenenza	Istituto di linguistica computazionale "Antonio Zampolli" - ILC	*
dc.contributor.appartenenza.mi	918	*
dc.contributor.area	Non assegn	*
dc.contributor.area	Non assegn	*
dc.contributor.area	Non assegn	*
dc.contributor.area	Non assegn	*
dc.date.firstsubmission	2026/05/06 15:10:54	*
dc.date.issued	2025	-
dc.date.submission	2026/05/06 15:10:54	*
dc.description.abstracteng	This paper aims to describe and analyze the activities related to the preservation and valorization of textual corpora of cultural-historical value, produced over a long period of time. We intend to share with the scientific community the problems related to the advancement of technologies used for data creation/processing, as well as the issues related to the transition from proprietary to standard formats to enable data sharing and interoperability. Finally, we will outline the complex transition to open data paradigms and the necessary steps for migrating data into international research infrastructures. Specifically, we will describe the translation process of Justinian’s Digest, emphasizing how this has evolved alongside technological progress. Our contribution will offer the DH community a point of view on the evolution of the digitization/computerization of large textual resources, based on a real use-case. To illustrate this, we will examine how specialized translation from Latin to Italian can be enhanced using textual analysis tools. Furthermore, we will describe the transformation of both the original and translated texts into a parallel bilingual corpus; its conversion into XML TEI format; the steps taken for depositing the data in the CLARIN research infrastructure.	-
dc.description.abstractita	Valorizzare e custodire il patrimonio culturale: alla scoperta del progetto Digesto. Il contributo vuole discutere delle attivita connesse alla salvaguardia e alla valorizzazione di corpora testuali di valore storicoculturale prodotti in un lungo arco temporale. Analizzeremo le problematiche legate al progresso delle tecnologie utilizzate per la creazione/elaborazione dei dati che sono mutate nel tempo, nonche l'arduo passaggio dai formati proprietari a quelli standard per una migliore condivisione e interoperabilita dei dati. Infine, descriveremo la non facile transizione verso paradigmi di dati aperti e i passaggi necessari per migrare i dati verso infrastrutture di ricerca internazionali. In particolare, descriveremo le fasi del progetto di traduzione del Digesto di Giustiniano che hanno richiesto il supporto tecnologico del nostro gruppo di ricerca, e come questo contributo e cambiato di pari passo con il progresso tecnologico. Vogliamo offrire alla comunita DH un punto di vista reale sull'evoluzione della digitalizzazione/informatizzazione di grandi risorse testuali. Nel caso specifico, discuteremo del supporto alla traduzione specializzata dal latino all'italiano con strumenti di analisi testuale, e della trasformazione dei testi originali e tradotti in un corpus bilingue parallelo; di come questo e stato convertito in formato XML TEI; infine, delle operazioni necessarie al deposito dei dati all'interno dell'infrastruttura di ricerca CLARIN.	-
dc.description.allpeople	Cinini, Alessandra; Marongiu, Paola; Sassolini, Eva; Monachini, Monica	-
dc.description.allpeopleoriginal	Alessandra Cinini, Paola Marongiu, Eva Sassolini, Monica Monachini	en
dc.description.fulltext	none	en
dc.description.numberofauthors	4	-
dc.identifier.doi	10.6092/unibo/amsacta/8380	en
dc.identifier.isbn	978-88-942535-9-7	en
dc.identifier.source	manual	*
dc.identifier.uri	https://hdl.handle.net/20.500.14243/579507	-
dc.identifier.url	https://amsacta.unibo.it/id/eprint/8380/	en
dc.language.iso	eng	en
dc.publisher.country	ITA	en
dc.publisher.name	AIUCD	en
dc.relation.alleditors	Simone Rebora, Marco Rospocher, Stefano Bazzaco	en
dc.relation.conferencedate	11-13 giugno 2025	en
dc.relation.conferencename	Diversità, Equità e Inclusione: Sfide e Opportunità per l’Informatica Umanistica nell’Era dell’Intelligenza Artificiale	en
dc.relation.conferenceplace	VERONA	en
dc.relation.firstpage	600	en
dc.relation.ispartofbook	Diversità, Equità e Inclusione: Sfide e Opportunità per l’Informatica Umanistica nell’Era dell’Intelligenza Artificiale, Proceedings del XIV Convegno Annuale AIUCD, Verona 11-13 giugno 2025, Università di Verona.	en
dc.relation.lastpage	607	en
dc.relation.medium	ELETTRONICO	en
dc.relation.numberofpages	8	en
dc.relation.projectAcronym	TESTO	en
dc.relation.projectAwardNumber	P20224NJLK _PRIN 2022 PNRR_SH2	en
dc.relation.projectAwardTitle	Translating, Encoding, Sharing The Origins. From the Littera Florentina to an open-access Italian translation of Justinian's Digest	en
dc.relation.projectFunderName	MUR - European Union - NextGenerationEU	en
dc.relation.projectFundingStream	242.939,00	en
dc.subject.keywordseng	texts corpora, standard TEI format, digital preservation	-
dc.subject.keywordsita	corpora testuali, standard TEI, preservazione digitale	-
dc.subject.singlekeyword	texts corpora	*
dc.subject.singlekeyword	standard TEI format	*
dc.subject.singlekeyword	digital preservation	*
dc.subject.singlekeyword	corpora testuali	*
dc.subject.singlekeyword	standard TEI	*
dc.subject.singlekeyword	preservazione digitale	*
dc.title	Preserving Preserving and enhancing cultural heritage: the Digest project	en
dc.type.circulation	Nazionale	en
dc.type.driver	info:eu-repo/semantics/conferenceObject	-
dc.type.full	04 Contributo in convegno::04.01 Contributo in Atti di convegno	it
dc.type.invited	contributo	en
dc.type.miur	273	-
dc.type.referee	Comitato scientifico	en
iris.orcid.lastModifiedDate	2026/05/06 15:10:54	*
iris.orcid.lastModifiedMillisecond	1778073054372	*
iris.sitodocente.maxattempts	1	-
iris.unpaywall.metadataCallLastModified	08/05/2026 05:26:47	-
iris.unpaywall.metadataCallLastModifiedMillisecond	1778210807419	-
iris.unpaywall.metadataErrorDescription	0	-
iris.unpaywall.metadataErrorType	ERROR_NO_MATCH	-
iris.unpaywall.metadataStatus	ERROR	-

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/579507

Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ente

Citazioni

ND

ND

ND

CNR Institutional Research Information System