Toward the implementation of a system for recognizing allusions to Dante's lexicon in Lager testimonies: the Voci dall’Inferno use case. Voci dall’Inferno is a research project by the University of Pisa, developed with the support of the Istituto di Linguistica Computazionale “A. Zampolli”. The initiative has two main scientific objectives: a) to digitize the first corpus of non-literary testimonies from concentration camp, and b) to identify the presence of citations and/or allusions to Dante's lexicon within them (Del Grosso et al., 2024). To achieve this second objective, a prototype web application called Voci dall’Inferno Verse Similarity Search was developed. The system is designed to detect citations and allusions to Dante’s vocabulary through computational approaches by searching for expression within the testimonies and comparing them with verses from Dante’s Commedia. The application, built in Python, leverages advanced technologies such as Weaviate, an open-source vector search platform, and Streamlit, a framework for web application development. Adopting sentence similarity metrics, the application uses machine learning models to transform texts into embedding representations and subsequently measure their similarity. Currently, the application is not yet publicly available. However, the CLARIN-IT research infrastructure (within H2IOSC PNRR project) has been contacted to host the application, ensuring accessibility and sustainability. A demo will be prepared for the conference if the contribution will be accepted.

Voci dall’Inferno è un progetto di ricerca dell’Università di Pisa, sviluppato con il supporto dell’Istituto di Linguistica Computazionale “A. Zampolli”. L’iniziativa ha due principali obiettivi scientifici: a) digitalizzare il primo corpus di testimonianze non letterarie di deportati sopravvissuti ai campi di concentramento e b) identificare al suo interno la presenza di citazioni e/o allusioni al lessico di Dante (Del Grosso et al.,2024). Al fine di raggiungere questo secondo obiettivo è stato sviluppato un prototipo di applicazione web denominata Voci dall’Inferno Verse Similarity Search. Il sistema è progettato per individuare citazioni e allusioni al lessico dantesco mediante approcci computazionali alla ricerca di frasi presenti nelle testimonianze e il confronto di essi con i versi presenti nella Divina Commedia di Dante Alighieri. L’applicazione, realizzata in Python, utilizza tecnologie avanzate come Weaviate, una piattaforma opensource per la ricerca vettoriale, e Streamlit, un framework per lo sviluppo di applicazioni web. Basandosi su metriche di Sentence Similarity, l’applicazione sfrutta modelli di machine learning per trasformare i testi in rappresentazioni di embeddings e in seguito misurarne la similarità. Attualmente l’applicazione non è ancora disponibile per l’uso da parte del pubblico, ciononostante l’infrastruttura di ricerca CLARIN-IT (H2IOSC) è stata contattata per ospitare l’applicazione garantendone accesso e sostenibilità. Una demo sarà predisposta per la conferenza qualora il contributo venisse accettato.

Verso l’implementazione di un sistema di riconoscimento di allusioni al lessico dantesco nelle testimonianze del Lager: il caso d’uso in Voci dall’Inferno

Angelo Mario Del Grosso
Co-primo
Writing – Original Draft Preparation
;
2025

Abstract

Toward the implementation of a system for recognizing allusions to Dante's lexicon in Lager testimonies: the Voci dall’Inferno use case. Voci dall’Inferno is a research project by the University of Pisa, developed with the support of the Istituto di Linguistica Computazionale “A. Zampolli”. The initiative has two main scientific objectives: a) to digitize the first corpus of non-literary testimonies from concentration camp, and b) to identify the presence of citations and/or allusions to Dante's lexicon within them (Del Grosso et al., 2024). To achieve this second objective, a prototype web application called Voci dall’Inferno Verse Similarity Search was developed. The system is designed to detect citations and allusions to Dante’s vocabulary through computational approaches by searching for expression within the testimonies and comparing them with verses from Dante’s Commedia. The application, built in Python, leverages advanced technologies such as Weaviate, an open-source vector search platform, and Streamlit, a framework for web application development. Adopting sentence similarity metrics, the application uses machine learning models to transform texts into embedding representations and subsequently measure their similarity. Currently, the application is not yet publicly available. However, the CLARIN-IT research infrastructure (within H2IOSC PNRR project) has been contacted to host the application, ensuring accessibility and sustainability. A demo will be prepared for the conference if the contribution will be accepted.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC en
dc.authority.people Carla Congiu en
dc.authority.people Angelo Mario Del Grosso en
dc.authority.people Marina Riccucci en
dc.collection.id.s 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d *
dc.collection.name 04.01 Contributo in Atti di convegno *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.contributor.area Non assegn *
dc.date.firstsubmission 2026/03/04 22:39:27 *
dc.date.issued 2025 -
dc.date.submission 2026/03/04 22:39:27 *
dc.description.abstracteng Toward the implementation of a system for recognizing allusions to Dante's lexicon in Lager testimonies: the Voci dall’Inferno use case. Voci dall’Inferno is a research project by the University of Pisa, developed with the support of the Istituto di Linguistica Computazionale “A. Zampolli”. The initiative has two main scientific objectives: a) to digitize the first corpus of non-literary testimonies from concentration camp, and b) to identify the presence of citations and/or allusions to Dante's lexicon within them (Del Grosso et al., 2024). To achieve this second objective, a prototype web application called Voci dall’Inferno Verse Similarity Search was developed. The system is designed to detect citations and allusions to Dante’s vocabulary through computational approaches by searching for expression within the testimonies and comparing them with verses from Dante’s Commedia. The application, built in Python, leverages advanced technologies such as Weaviate, an open-source vector search platform, and Streamlit, a framework for web application development. Adopting sentence similarity metrics, the application uses machine learning models to transform texts into embedding representations and subsequently measure their similarity. Currently, the application is not yet publicly available. However, the CLARIN-IT research infrastructure (within H2IOSC PNRR project) has been contacted to host the application, ensuring accessibility and sustainability. A demo will be prepared for the conference if the contribution will be accepted. -
dc.description.abstractita Voci dall’Inferno è un progetto di ricerca dell’Università di Pisa, sviluppato con il supporto dell’Istituto di Linguistica Computazionale “A. Zampolli”. L’iniziativa ha due principali obiettivi scientifici: a) digitalizzare il primo corpus di testimonianze non letterarie di deportati sopravvissuti ai campi di concentramento e b) identificare al suo interno la presenza di citazioni e/o allusioni al lessico di Dante (Del Grosso et al.,2024). Al fine di raggiungere questo secondo obiettivo è stato sviluppato un prototipo di applicazione web denominata Voci dall’Inferno Verse Similarity Search. Il sistema è progettato per individuare citazioni e allusioni al lessico dantesco mediante approcci computazionali alla ricerca di frasi presenti nelle testimonianze e il confronto di essi con i versi presenti nella Divina Commedia di Dante Alighieri. L’applicazione, realizzata in Python, utilizza tecnologie avanzate come Weaviate, una piattaforma opensource per la ricerca vettoriale, e Streamlit, un framework per lo sviluppo di applicazioni web. Basandosi su metriche di Sentence Similarity, l’applicazione sfrutta modelli di machine learning per trasformare i testi in rappresentazioni di embeddings e in seguito misurarne la similarità. Attualmente l’applicazione non è ancora disponibile per l’uso da parte del pubblico, ciononostante l’infrastruttura di ricerca CLARIN-IT (H2IOSC) è stata contattata per ospitare l’applicazione garantendone accesso e sostenibilità. Una demo sarà predisposta per la conferenza qualora il contributo venisse accettato. -
dc.description.allpeople Congiu, Carla; Del Grosso, Angelo Mario; Riccucci, Marina -
dc.description.allpeopleoriginal Carla Congiu, Angelo Mario Del Grosso, Marina Riccucci en
dc.description.fulltext none en
dc.description.numberofauthors 3 -
dc.identifier.doi 10.6092/unibo/amsacta/8380 en
dc.identifier.isbn 978-88-942535-9-7 en
dc.identifier.source manual *
dc.identifier.uri https://hdl.handle.net/20.500.14243/571301 -
dc.identifier.url https://amsacta.unibo.it/id/eprint/8380/ en
dc.language.iso ita en
dc.publisher.name AIUCD en
dc.relation.alleditors Simone Rebora, Marco Rospocher, Stefano Bazzaco en
dc.relation.conferencedate 11-13 giugno 2025 en
dc.relation.conferencename Diversity, Equity, and Inclusion: Challenges and Opportunities for Digital Humanities in the Age of Artificial Intelligence en
dc.relation.conferenceplace Verona en
dc.relation.firstpage 270 en
dc.relation.ispartofbook Diversity, Equity, and Inclusion: Challenges and Opportunities for Digital Humanities in the Age of Artificial Intelligence, Proceedings del XIV Convegno Annuale AIUCD, Verona 11-13 giugno 2025, Università di Verona. en
dc.relation.lastpage 275 en
dc.relation.medium ELETTRONICO en
dc.relation.numberofpages 6 en
dc.subject.keywordseng Voci dall’Inferno, Sentence Similarity, Sentence Transformers, vector database, embeddings -
dc.subject.keywordsita Sentence Similarity, Sentence Transformers, vector database, embeddings, Voci dall’Inferno -
dc.subject.singlekeyword Voci dall’Inferno *
dc.subject.singlekeyword Sentence Similarity *
dc.subject.singlekeyword Sentence Transformers *
dc.subject.singlekeyword vector database *
dc.subject.singlekeyword embeddings *
dc.subject.singlekeyword Sentence Similarity *
dc.subject.singlekeyword Sentence Transformers *
dc.subject.singlekeyword vector database *
dc.subject.singlekeyword embeddings *
dc.subject.singlekeyword Voci dall’Inferno *
dc.title Verso l’implementazione di un sistema di riconoscimento di allusioni al lessico dantesco nelle testimonianze del Lager: il caso d’uso in Voci dall’Inferno en
dc.type.circulation Internazionale en
dc.type.driver info:eu-repo/semantics/conferenceObject -
dc.type.full 04 Contributo in convegno::04.01 Contributo in Atti di convegno it
dc.type.invited contributo en
dc.type.miur 273 -
dc.type.referee Esperti anonimi en
iris.orcid.lastModifiedDate 2026/03/04 22:39:27 *
iris.orcid.lastModifiedMillisecond 1772660367038 *
iris.sitodocente.maxattempts 1 -
iris.unpaywall.metadataCallLastModified 05/03/2026 05:01:24 -
iris.unpaywall.metadataCallLastModifiedMillisecond 1772683284282 -
iris.unpaywall.metadataErrorDescription 0 -
iris.unpaywall.metadataErrorType ERROR_NO_MATCH -
iris.unpaywall.metadataStatus ERROR -
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/571301
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ente

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact