We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades.
Presentiamo ISACCO (Italian school-age children corpus), un nuovo corpus di riassunti orali e scritti prodotti da bambini italiani della scuola primaria. Tutti i testi sono stati digitalizzati e arricchiti automaticamente con informazione linguistica per consentire esplorazioni preliminari basate su caratteristiche estratte con strumenti di TAL. I riassunti scritti sono stati anche annotati a mano con una tipologia di errori linguistici. La risorsa è pensata per lo studio e la definizione di modelli computazionali degli stadi più avanzati del processo di acquisizione linguistica, con un'enfasi per la valutazione comparativa delle abilità linguistiche orali e scritte nei primi anni scolastici.
ISACCO: a corpus for investigating spoken and written language development in Italian school-age children
D Brunato;F Dell'Orletta
2015
Abstract
We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades.| Campo DC | Valore | Lingua |
|---|---|---|
| dc.authority.orgunit | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | - |
| dc.authority.people | D Brunato | it |
| dc.authority.people | F Dell'Orletta | it |
| dc.collection.id.s | 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d | * |
| dc.collection.name | 04.01 Contributo in Atti di convegno | * |
| dc.contributor.appartenenza | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | * |
| dc.contributor.appartenenza.mi | 918 | * |
| dc.date.accessioned | 2024/02/20 01:18:58 | - |
| dc.date.available | 2024/02/20 01:18:58 | - |
| dc.date.issued | 2015 | - |
| dc.description.abstracteng | We present ISACCO (Italian school-age children corpus)1, a new corpus of oral and written retellings of Italian speaking children attending the primary school. All texts were digitalized and automatically enriched with linguistic information allowing preliminary explorations based on NLP features. Written retellings were also manually annotated with a typology of linguistic errors. The resource is conceived to support research and computational modeling of "later language acquisition", with an emphasis for comparative assessment of oral and written language skills across early school grades. | - |
| dc.description.abstractita | Presentiamo ISACCO (Italian school-age children corpus), un nuovo corpus di riassunti orali e scritti prodotti da bambini italiani della scuola primaria. Tutti i testi sono stati digitalizzati e arricchiti automaticamente con informazione linguistica per consentire esplorazioni preliminari basate su caratteristiche estratte con strumenti di TAL. I riassunti scritti sono stati anche annotati a mano con una tipologia di errori linguistici. La risorsa è pensata per lo studio e la definizione di modelli computazionali degli stadi più avanzati del processo di acquisizione linguistica, con un'enfasi per la valutazione comparativa delle abilità linguistiche orali e scritte nei primi anni scolastici. | - |
| dc.description.affiliations | ISTITUTO DI LINGUISTICA COMPUTAZIONALE "ANTONIO ZAMPOLLI" (ILC-CNR) | - |
| dc.description.allpeople | D. Brunato; F. Dell'Orletta | - |
| dc.description.allpeopleoriginal | D. Brunato, F. Dell'Orletta | - |
| dc.description.fulltext | none | en |
| dc.description.numberofauthors | 2 | - |
| dc.identifier.isbn | 978-88-99200-62-6 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.14243/321093 | - |
| dc.identifier.url | http://www.italianlp.it/wp-content/uploads/2016/03/IsaccoCorpus.pdf | - |
| dc.language.iso | eng | - |
| dc.publisher.country | ITA | - |
| dc.publisher.name | Accademia University Press | - |
| dc.publisher.place | Torino | - |
| dc.relation.alleditors | Cristina Bosco, Sara Tonelli, Fabio Massimo Zanzotto | - |
| dc.relation.conferencedate | 03/12/2015-04/12/2015 | - |
| dc.relation.conferencename | Second Italian Conference on Computational Linguistics (CLiC-it 2015) | - |
| dc.relation.conferenceplace | Trento | - |
| dc.relation.firstpage | 62 | - |
| dc.relation.ispartofbook | Proceedings of the Second Italian Conference on Computational Linguistics (CLiC-it 2015) | - |
| dc.relation.lastpage | 66 | - |
| dc.relation.numberofpages | 4 | - |
| dc.subject.keywords | Child language acquisition | - |
| dc.subject.keywords | Oral and written language | - |
| dc.subject.keywords | multi-level linguistic analysis | - |
| dc.subject.singlekeyword | Child language acquisition | * |
| dc.subject.singlekeyword | Oral and written language | * |
| dc.subject.singlekeyword | multi-level linguistic analysis | * |
| dc.title | ISACCO: a corpus for investigating spoken and written language development in Italian school-age children | en |
| dc.type.driver | info:eu-repo/semantics/conferenceObject | - |
| dc.type.full | 04 Contributo in convegno::04.01 Contributo in Atti di convegno | it |
| dc.type.miur | 273 | - |
| dc.type.referee | Sì, ma tipo non specificato | - |
| dc.ugov.descaux1 | 359256 | - |
| iris.orcid.lastModifiedDate | 2024/03/02 02:33:07 | * |
| iris.orcid.lastModifiedMillisecond | 1709343187492 | * |
| iris.sitodocente.maxattempts | 1 | - |
| Appare nelle tipologie: | 04.01 Contributo in Atti di convegno | |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


