This report describes the activities carried out under the Operating Agreement on the development of software functions for the recovery of Archives Textual ILC texts and conversion to a format of XML /TEI representation, stipulated in the Agreement Scientific Collaboration ILC-CNR - Accademia della Crusca. In particular, the report focuses on the following subject of the Operating Agreement: 1. definition of a format of XML /TEI representation that takes into account on the one hand the type of annotations in the source text and the other of the analysis and processing to which the converted text will have to be subjected; 2. development of procedures for converting the format of "Periodici Milanesi" to the XML format / TEI and verification of the results by parsing XML. The report traces the different phases of the work, with a focus archive textual analysis of departure and the results achieved, to get to a discussion of the issues that remain open at the time and the developments that can be envisaged for such activities.

Il presente rapporto documenta le attività svolte nell'ambito della Convenzione Operativa relativa allo sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e la conversione in un formato di rappresentazione XML/TEI, stipulata all'interno dell'Accordo di Collaborazione Scientifica ILC-CNR - Accademia della Crusca. In particolare, il rapporto si focalizza sui seguenti punti oggetto della Convenzione Operativa: 1. definizione di un formato di rappresentazione XML/TEI che tenga conto da un lato della tipologia di annotazioni presenti nei testi di partenza e dall'altro delle analisi ed elaborazioni a cui i testi convertiti dovranno essere sottoposti; 2. sviluppo di procedure di conversione dal formato dei "Periodici Milanesi" al formato XML/TEI e verifica dei risultati mediante parsing XML. Il Rapporto ripercorre le diverse fasi del lavoro, con particolare attenzione all'analisi dell'archivio testuale di partenza e ai risultati raggiunti, per arrivare a una discussione delle questioni che rimangono al momento aperte e degli sviluppi che possono prospettarsi per tali attività.

Sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e conversione in un formato di rappresentazione XML/TEI

Cucurullo Sebastiana
2015

Abstract

Il presente rapporto documenta le attività svolte nell'ambito della Convenzione Operativa relativa allo sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e la conversione in un formato di rappresentazione XML/TEI, stipulata all'interno dell'Accordo di Collaborazione Scientifica ILC-CNR - Accademia della Crusca. In particolare, il rapporto si focalizza sui seguenti punti oggetto della Convenzione Operativa: 1. definizione di un formato di rappresentazione XML/TEI che tenga conto da un lato della tipologia di annotazioni presenti nei testi di partenza e dall'altro delle analisi ed elaborazioni a cui i testi convertiti dovranno essere sottoposti; 2. sviluppo di procedure di conversione dal formato dei "Periodici Milanesi" al formato XML/TEI e verifica dei risultati mediante parsing XML. Il Rapporto ripercorre le diverse fasi del lavoro, con particolare attenzione all'analisi dell'archivio testuale di partenza e ai risultati raggiunti, per arrivare a una discussione delle questioni che rimangono al momento aperte e degli sviluppi che possono prospettarsi per tali attività.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC -
dc.authority.people Cucurullo Sebastiana it
dc.collection.id.s 95773a9f-8d06-4466-a951-5d4e15d70690 *
dc.collection.name 08.04 Rapporto tecnico *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/21 03:05:17 -
dc.date.available 2024/02/21 03:05:17 -
dc.date.issued 2015 -
dc.description.abstract This report describes the activities carried out under the Operating Agreement on the development of software functions for the recovery of Archives Textual ILC texts and conversion to a format of XML /TEI representation, stipulated in the Agreement Scientific Collaboration ILC-CNR - Accademia della Crusca. In particular, the report focuses on the following subject of the Operating Agreement: 1. definition of a format of XML /TEI representation that takes into account on the one hand the type of annotations in the source text and the other of the analysis and processing to which the converted text will have to be subjected; 2. development of procedures for converting the format of "Periodici Milanesi" to the XML format / TEI and verification of the results by parsing XML. The report traces the different phases of the work, with a focus archive textual analysis of departure and the results achieved, to get to a discussion of the issues that remain open at the time and the developments that can be envisaged for such activities. -
dc.description.abstracteng Il presente rapporto documenta le attività svolte nell'ambito della Convenzione Operativa relativa allo sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e la conversione in un formato di rappresentazione XML/TEI, stipulata all'interno dell'Accordo di Collaborazione Scientifica ILC-CNR - Accademia della Crusca. In particolare, il rapporto si focalizza sui seguenti punti oggetto della Convenzione Operativa: 1. definizione di un formato di rappresentazione XML/TEI che tenga conto da un lato della tipologia di annotazioni presenti nei testi di partenza e dall'altro delle analisi ed elaborazioni a cui i testi convertiti dovranno essere sottoposti; 2. sviluppo di procedure di conversione dal formato dei "Periodici Milanesi" al formato XML/TEI e verifica dei risultati mediante parsing XML. Il Rapporto ripercorre le diverse fasi del lavoro, con particolare attenzione all'analisi dell'archivio testuale di partenza e ai risultati raggiunti, per arrivare a una discussione delle questioni che rimangono al momento aperte e degli sviluppi che possono prospettarsi per tali attività. -
dc.description.affiliations ILC - Istituto di Linguistica Computazionale "Antonio Zampolli" -
dc.description.allpeople Cucurullo, Sebastiana -
dc.description.allpeopleoriginal Cucurullo Sebastiana -
dc.description.fulltext none en
dc.description.numberofauthors 1 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/316210 -
dc.language.iso ita -
dc.relation.numberofpages 43 -
dc.subject.keywords banca-dati testuale -
dc.subject.keywords Periodici Milanesi -
dc.subject.singlekeyword banca-dati testuale *
dc.subject.singlekeyword Periodici Milanesi *
dc.title Sviluppo di funzioni software per il recupero di testi dell'Archivio Testuale dell'ILC e conversione in un formato di rappresentazione XML/TEI en
dc.type.driver info:eu-repo/semantics/other -
dc.type.full 08 Report e Working Paper::08.04 Rapporto tecnico it
dc.type.miur -2.0 -
dc.ugov.descaux1 353217 -
iris.orcid.lastModifiedDate 2024/04/04 11:23:56 *
iris.orcid.lastModifiedMillisecond 1712222636511 *
iris.sitodocente.maxattempts 1 -
Appare nelle tipologie: 08.04 Rapporto tecnico
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/316210
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact