This report describes the activities carried out under the Operating Agreement on the development of software functions for the recovery of Archives Textual ILC texts and conversion to a format of XML /TEI representation, stipulated in the Agreement Scientific Collaboration ILC-CNR - Accademia della Crusca. In particular, the report focuses on the following subject of the Operating Agreement: 1. definition of a format of XML /TEI representation that takes into account on the one hand the type of annotations in the source text and the other of the analysis and processing to which the converted text will have to be subjected; 2. development of procedures for converting the format of "Periodici Milanesi" to the XML format / TEI and verification of the results by parsing XML. The report traces the different phases of the work, with a focus archive textual analysis of departure and the results achieved, to get to a discussion of the issues that remain open at the time and the developments that can be envisaged for such activities.
Il presente rapporto documenta le attività svolte nell'ambito della Convenzione Operativa relativa allo sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e la conversione in un formato di rappresentazione XML/TEI, stipulata all'interno dell'Accordo di Collaborazione Scientifica ILC-CNR - Accademia della Crusca. In particolare, il rapporto si focalizza sui seguenti punti oggetto della Convenzione Operativa: 1. definizione di un formato di rappresentazione XML/TEI che tenga conto da un lato della tipologia di annotazioni presenti nei testi di partenza e dall'altro delle analisi ed elaborazioni a cui i testi convertiti dovranno essere sottoposti; 2. sviluppo di procedure di conversione dal formato dei "Periodici Milanesi" al formato XML/TEI e verifica dei risultati mediante parsing XML. Il Rapporto ripercorre le diverse fasi del lavoro, con particolare attenzione all'analisi dell'archivio testuale di partenza e ai risultati raggiunti, per arrivare a una discussione delle questioni che rimangono al momento aperte e degli sviluppi che possono prospettarsi per tali attività.
Sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e conversione in un formato di rappresentazione XML/TEI
Cucurullo Sebastiana
2015
Abstract
Il presente rapporto documenta le attività svolte nell'ambito della Convenzione Operativa relativa allo sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e la conversione in un formato di rappresentazione XML/TEI, stipulata all'interno dell'Accordo di Collaborazione Scientifica ILC-CNR - Accademia della Crusca. In particolare, il rapporto si focalizza sui seguenti punti oggetto della Convenzione Operativa: 1. definizione di un formato di rappresentazione XML/TEI che tenga conto da un lato della tipologia di annotazioni presenti nei testi di partenza e dall'altro delle analisi ed elaborazioni a cui i testi convertiti dovranno essere sottoposti; 2. sviluppo di procedure di conversione dal formato dei "Periodici Milanesi" al formato XML/TEI e verifica dei risultati mediante parsing XML. Il Rapporto ripercorre le diverse fasi del lavoro, con particolare attenzione all'analisi dell'archivio testuale di partenza e ai risultati raggiunti, per arrivare a una discussione delle questioni che rimangono al momento aperte e degli sviluppi che possono prospettarsi per tali attività.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.