Il corso affronta le tematiche legate alla gestione dei dati linguistici orali. Dopo un'introduzione generale alle possibilità offerte dall'infrastruttura CLARIN ERIC in fase di scoperta, raccolta e deposito di dati orali, si approfondiranno le questioni etico-legali connesse alla raccolta, gestione e conservazione dei dati e il procedimento di trascrizione automatica, con ulteriori possibilità di annotazione attraverso strumenti ti trattamento automatico del linguaggio. Il corso è stato sviluppato con la collaborazione dei docenti della CLARIN Traners' Network nell'ambito della partecipazione di CLARIN-IT al Progetto H2IOSC - Humanities and cultural Heritage Italian Open Science Cloud finanziato dall’Unione Europea NextGenerationEU – PNRR M4C2 – Codice progetto IR0000029 – CUP B63C22000730005. Il materiale si compone di tre unità: Unità 1 - I Dati Linguistici Orali in CLARIN Questa unità fornisce una panoramica delle risorse e dei servizi offerti dall'Infrastruttura di Ricerca CLARIN ERIC a supporto della scoperta, dell'annotazione e del deposito dei dati linguistici orali in accordo con i principi FAIR e le buone pratiche della Scienza Aperta. Unità 2 - Raccolta e Gestione dei Dati Orali L'unità propone un'introduzione alle problematiche legate alla gestione dei dati orali dal punto di vista etico e legale. Gli aspetti legati al GDPR e alla normativa italiana di riferimento sono approfonditi in un gioco di ruolo interattivo. Unità 3 - Laboratorio di Trascrizione Automatica In questa unità interattiva, saranno affrontate le questioni relative ad alcuni strumenti e i software utili per la trascrizione dei dati. Si ringraziano le ricercatrici e i ricercatori impegnate/i nel progetto PRIN Corpus SIM (Senecta Ipsa Morbus) - Spontaneous speech in healthy ageing per aver attivamente partecipato alle sessioni di didattica del 16 e 17 settembre 2024 presso l'Università di Firenze, da cui è stato tratto il materiale del corso.

Introduzione alla Gestione dei Dati Orali

Francesca Frontini;Giulia Pedonese;
2025

Abstract

Il corso affronta le tematiche legate alla gestione dei dati linguistici orali. Dopo un'introduzione generale alle possibilità offerte dall'infrastruttura CLARIN ERIC in fase di scoperta, raccolta e deposito di dati orali, si approfondiranno le questioni etico-legali connesse alla raccolta, gestione e conservazione dei dati e il procedimento di trascrizione automatica, con ulteriori possibilità di annotazione attraverso strumenti ti trattamento automatico del linguaggio. Il corso è stato sviluppato con la collaborazione dei docenti della CLARIN Traners' Network nell'ambito della partecipazione di CLARIN-IT al Progetto H2IOSC - Humanities and cultural Heritage Italian Open Science Cloud finanziato dall’Unione Europea NextGenerationEU – PNRR M4C2 – Codice progetto IR0000029 – CUP B63C22000730005. Il materiale si compone di tre unità: Unità 1 - I Dati Linguistici Orali in CLARIN Questa unità fornisce una panoramica delle risorse e dei servizi offerti dall'Infrastruttura di Ricerca CLARIN ERIC a supporto della scoperta, dell'annotazione e del deposito dei dati linguistici orali in accordo con i principi FAIR e le buone pratiche della Scienza Aperta. Unità 2 - Raccolta e Gestione dei Dati Orali L'unità propone un'introduzione alle problematiche legate alla gestione dei dati orali dal punto di vista etico e legale. Gli aspetti legati al GDPR e alla normativa italiana di riferimento sono approfonditi in un gioco di ruolo interattivo. Unità 3 - Laboratorio di Trascrizione Automatica In questa unità interattiva, saranno affrontate le questioni relative ad alcuni strumenti e i software utili per la trascrizione dei dati. Si ringraziano le ricercatrici e i ricercatori impegnate/i nel progetto PRIN Corpus SIM (Senecta Ipsa Morbus) - Spontaneous speech in healthy ageing per aver attivamente partecipato alle sessioni di didattica del 16 e 17 settembre 2024 presso l'Università di Firenze, da cui è stato tratto il materiale del corso.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC en
dc.authority.people Henk van den Heuvel en
dc.authority.people Christoph Draxler en
dc.authority.people Francesca Frontini en
dc.authority.people Giulia Pedonese en
dc.authority.people Iulianna van der Lek en
dc.authority.project Codice progetto IR0000029 en
dc.collection.id.s 24340a81-3a00-43be-8cdb-4d89deb2836e *
dc.collection.name 05.14 Materiale didattico *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.contributor.area Non assegn *
dc.contributor.area Non assegn *
dc.date.firstsubmission 2025/12/30 17:44:41 *
dc.date.issued 2025 -
dc.date.submission 2025/12/30 17:44:41 *
dc.description.abstractita Il corso affronta le tematiche legate alla gestione dei dati linguistici orali. Dopo un'introduzione generale alle possibilità offerte dall'infrastruttura CLARIN ERIC in fase di scoperta, raccolta e deposito di dati orali, si approfondiranno le questioni etico-legali connesse alla raccolta, gestione e conservazione dei dati e il procedimento di trascrizione automatica, con ulteriori possibilità di annotazione attraverso strumenti ti trattamento automatico del linguaggio. Il corso è stato sviluppato con la collaborazione dei docenti della CLARIN Traners' Network nell'ambito della partecipazione di CLARIN-IT al Progetto H2IOSC - Humanities and cultural Heritage Italian Open Science Cloud finanziato dall’Unione Europea NextGenerationEU – PNRR M4C2 – Codice progetto IR0000029 – CUP B63C22000730005. Il materiale si compone di tre unità: Unità 1 - I Dati Linguistici Orali in CLARIN Questa unità fornisce una panoramica delle risorse e dei servizi offerti dall'Infrastruttura di Ricerca CLARIN ERIC a supporto della scoperta, dell'annotazione e del deposito dei dati linguistici orali in accordo con i principi FAIR e le buone pratiche della Scienza Aperta. Unità 2 - Raccolta e Gestione dei Dati Orali L'unità propone un'introduzione alle problematiche legate alla gestione dei dati orali dal punto di vista etico e legale. Gli aspetti legati al GDPR e alla normativa italiana di riferimento sono approfonditi in un gioco di ruolo interattivo. Unità 3 - Laboratorio di Trascrizione Automatica In questa unità interattiva, saranno affrontate le questioni relative ad alcuni strumenti e i software utili per la trascrizione dei dati. Si ringraziano le ricercatrici e i ricercatori impegnate/i nel progetto PRIN Corpus SIM (Senecta Ipsa Morbus) - Spontaneous speech in healthy ageing per aver attivamente partecipato alle sessioni di didattica del 16 e 17 settembre 2024 presso l'Università di Firenze, da cui è stato tratto il materiale del corso. -
dc.description.allpeople Van Den Heuvel, Henk; Draxler, Christoph; Frontini, Francesca; Pedonese, Giulia; Van Der Lek, Iulianna -
dc.description.allpeopleoriginal Henk van den Heuvel; Christoph Draxler; Francesca Frontini; Giulia Pedonese; Iulianna van der Lek en
dc.description.fulltext none en
dc.description.international si en
dc.description.numberofauthors 5 -
dc.identifier.doi 10.5281/zenodo.17183051 en
dc.identifier.source orcid *
dc.identifier.uri https://hdl.handle.net/20.500.14243/561742 -
dc.language.iso ita en
dc.relation.projectAcronym H2IOSC en
dc.relation.projectAwardNumber CUP B63C22000730005 en
dc.relation.projectAwardTitle Humanities and cultural Heritage Italian Open Science Cloud en
dc.relation.projectFunderName Unione Europea en
dc.relation.projectFundingStream NextGenerationEU – PNRR M4C2 en
dc.subject.keywordsita Dati orali -
dc.subject.keywordsita Archivi orali -
dc.subject.keywordsita Trascrizione automatica -
dc.subject.singlekeyword Dati orali *
dc.subject.singlekeyword Archivi orali *
dc.subject.singlekeyword Trascrizione automatica *
dc.title Introduzione alla Gestione dei Dati Orali en
dc.type.driver info:eu-repo/semantics/other -
dc.type.full 05 Altro::05.14 Materiale didattico it
dc.type.miur -2 -
iris.orcid.lastModifiedDate 2025/12/30 17:44:41 *
iris.orcid.lastModifiedMillisecond 1767113081056 *
iris.sitodocente.maxattempts 1 -
iris.unpaywall.metadataCallLastModified 01/01/2026 03:36:29 -
iris.unpaywall.metadataCallLastModifiedMillisecond 1767234989155 -
iris.unpaywall.metadataErrorDescription 0 -
iris.unpaywall.metadataErrorType ERROR_NO_MATCH -
iris.unpaywall.metadataStatus ERROR -
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/561742
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ente

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact