We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades.

Presentiamo ISACCO (Italian school-age children corpus), un nuovo corpus di riassunti orali e scritti prodotti da bambini italiani della scuola primaria. Tutti i testi sono stati digitalizzati e arricchiti automaticamente con informazione linguistica per consentire esplorazioni preliminari basate su caratteristiche estratte con strumenti di TAL. I riassunti scritti sono stati anche annotati a mano con una tipologia di errori linguistici. La risorsa è pensata per lo studio e la definizione di modelli computazionali degli stadi più avanzati del processo di acquisizione linguistica, con un'enfasi per la valutazione comparativa delle abilità linguistiche orali e scritte nei primi anni scolastici.

ISACCO: a corpus for investigating spoken and written language development in Italian school-age children

D Brunato;F Dell'Orletta
2015

Abstract

We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC -
dc.authority.people D Brunato it
dc.authority.people F Dell'Orletta it
dc.collection.id.s 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d *
dc.collection.name 04.01 Contributo in Atti di convegno *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/20 01:18:58 -
dc.date.available 2024/02/20 01:18:58 -
dc.date.issued 2015 -
dc.description.abstracteng We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades. -
dc.description.abstractita Presentiamo ISACCO (Italian school-age children corpus), un nuovo corpus di riassunti orali e scritti prodotti da bambini italiani della scuola primaria. Tutti i testi sono stati digitalizzati e arricchiti automaticamente con informazione linguistica per consentire esplorazioni preliminari basate su caratteristiche estratte con strumenti di TAL. I riassunti scritti sono stati anche annotati a mano con una tipologia di errori linguistici. La risorsa è pensata per lo studio e la definizione di modelli computazionali degli stadi più avanzati del processo di acquisizione linguistica, con un'enfasi per la valutazione comparativa delle abilità linguistiche orali e scritte nei primi anni scolastici. -
dc.description.affiliations ISTITUTO DI LINGUISTICA COMPUTAZIONALE "ANTONIO ZAMPOLLI" (ILC-CNR) -
dc.description.allpeople D. Brunato; F. Dell'Orletta -
dc.description.allpeopleoriginal D. Brunato, F. Dell'Orletta -
dc.description.fulltext none en
dc.description.numberofauthors 2 -
dc.identifier.isbn 978-88-99200-62-6 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/321093 -
dc.identifier.url http://www.italianlp.it/wp-content/uploads/2016/03/IsaccoCorpus.pdf -
dc.language.iso eng -
dc.publisher.country ITA -
dc.publisher.name Accademia University Press -
dc.publisher.place Torino -
dc.relation.alleditors Cristina Bosco, Sara Tonelli, Fabio Massimo Zanzotto -
dc.relation.conferencedate 03/12/2015-04/12/2015 -
dc.relation.conferencename Second Italian Conference on Computational Linguistics (CLiC-it 2015) -
dc.relation.conferenceplace Trento -
dc.relation.firstpage 62 -
dc.relation.ispartofbook Proceedings of the Second Italian Conference on Computational Linguistics (CLiC-it 2015) -
dc.relation.lastpage 66 -
dc.relation.numberofpages 4 -
dc.subject.keywords Child language acquisition -
dc.subject.keywords Oral and written language -
dc.subject.keywords multi-level linguistic analysis -
dc.subject.singlekeyword Child language acquisition *
dc.subject.singlekeyword Oral and written language *
dc.subject.singlekeyword multi-level linguistic analysis *
dc.title ISACCO: a corpus for investigating spoken and written language development in Italian school-age children en
dc.type.driver info:eu-repo/semantics/conferenceObject -
dc.type.full 04 Contributo in convegno::04.01 Contributo in Atti di convegno it
dc.type.miur 273 -
dc.type.referee Sì, ma tipo non specificato -
dc.ugov.descaux1 359256 -
iris.orcid.lastModifiedDate 2024/03/02 02:33:07 *
iris.orcid.lastModifiedMillisecond 1709343187492 *
iris.sitodocente.maxattempts 1 -
Appare nelle tipologie: 04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/321093
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact