Il presente rapporto tecnico descrive i requisiti, l'architettura ed il deployment della piattaforma Alpha EVO, sviluppata nell'ambito del progetto di digitalizzazione dei contenuti degli archivi storici degli Ospedali Psichiatrici Italiani. L'obiettivo e' stato quello di implementare una piattaforma per la pubblicazione online di manoscritti digitalizzati, comprendendo le scansioni degli stessi, le trascrizioni ed i metadati archivistici ISADg. Il documento illustra i formati standard e gli strumenti open-source utilizzati (AToM, eScriptorium, page2tei, cudl-data-processing-xslt), evidenziando le procedure di estrazione, conversione e normalizzazione dei metadati (EAD-XML, METS, PAGE-XML, TEI) e la loro trasformazione in JSON per l'integrazione con la componente front-end Cambridge University Digital Library Viewer (cudl-viewer). Sono inoltre trattati i requisiti di sicurezza (cifratura server-side, autenticazione, controllo accessi, protezione da vulnerabilita' OWASP) e accessibilita' (linee guida AGID, WCAG 2.1). L'architettura della piattaforma e' basata su container Docker, ognuno dei quali a sua volta espone un servizio necessario all'intera piattaforma (Python/Flask proxy, Nginx, Tomcat, IIIF server, Solr, API per trascrizioni e ricerche), ma isolandolo dalla macchina host. Questa scelta garantisce portabilita', scalabilita' e protezione dei dati sensibili. Infine, il manuale amministratore fornisce istruzioni operative per l'installazione, la configurazione e la gestione di utenti, collezioni e documenti.

Alpha EVO - Nota Tecnica

Alessio Portaro
2025

Abstract

Il presente rapporto tecnico descrive i requisiti, l'architettura ed il deployment della piattaforma Alpha EVO, sviluppata nell'ambito del progetto di digitalizzazione dei contenuti degli archivi storici degli Ospedali Psichiatrici Italiani. L'obiettivo e' stato quello di implementare una piattaforma per la pubblicazione online di manoscritti digitalizzati, comprendendo le scansioni degli stessi, le trascrizioni ed i metadati archivistici ISADg. Il documento illustra i formati standard e gli strumenti open-source utilizzati (AToM, eScriptorium, page2tei, cudl-data-processing-xslt), evidenziando le procedure di estrazione, conversione e normalizzazione dei metadati (EAD-XML, METS, PAGE-XML, TEI) e la loro trasformazione in JSON per l'integrazione con la componente front-end Cambridge University Digital Library Viewer (cudl-viewer). Sono inoltre trattati i requisiti di sicurezza (cifratura server-side, autenticazione, controllo accessi, protezione da vulnerabilita' OWASP) e accessibilita' (linee guida AGID, WCAG 2.1). L'architettura della piattaforma e' basata su container Docker, ognuno dei quali a sua volta espone un servizio necessario all'intera piattaforma (Python/Flask proxy, Nginx, Tomcat, IIIF server, Solr, API per trascrizioni e ricerche), ma isolandolo dalla macchina host. Questa scelta garantisce portabilita', scalabilita' e protezione dei dati sensibili. Infine, il manuale amministratore fornisce istruzioni operative per l'installazione, la configurazione e la gestione di utenti, collezioni e documenti.
2025
Istituto di informatica e telematica - IIT - Sede Secondaria Arcavacata di Rende
digitization workflow, transcriptions workflow, historical archive
File in questo prodotto:
File Dimensione Formato  
IITB4-04-2025.pdf

solo utenti autorizzati

Licenza: NON PUBBLICO - Accesso privato/ristretto
Dimensione 3.37 MB
Formato Adobe PDF
3.37 MB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/555031
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact