La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale.

Modelli, metodi e strumenti per il trattamento automatico della lingua araba e per l'editing in ambienti collaborativi

Boschetti Federico;Del Gratta Riccardo;Marzi Claudia;Nahli Ouafae;Pirrelli Vito
2014

Abstract

La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC en
dc.authority.people Boschetti Federico en
dc.authority.people Del Gratta Riccardo en
dc.authority.people Marzi Claudia en
dc.authority.people Nahli Ouafae en
dc.authority.people Pirrelli Vito en
dc.collection.id.s 69aaa6b3-f0f0-47c1-b9a1-040bae867ec3 *
dc.collection.name 04.02 Abstract in Atti di convegno *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/19 21:13:43 -
dc.date.available 2024/02/19 21:13:43 -
dc.date.firstsubmission 2024/09/30 16:30:17 *
dc.date.issued 2014 -
dc.date.submission 2024/09/30 16:30:17 *
dc.description.abstractita La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale. -
dc.description.affiliations Institute for Computational Linguistics - National Research Council (ILC-CNR, Pisa) -
dc.description.allpeople Boschetti, Federico; DEL GRATTA, Riccardo; Marzi, Claudia; Nahli, Ouafae; Pirrelli, Vito -
dc.description.allpeopleoriginal Boschetti, Federico; Del Gratta, Riccardo; Marzi, Claudia; Nahli, Ouafae; Pirrelli, Vito en
dc.description.fulltext none en
dc.description.numberofauthors 5 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/230690 -
dc.identifier.url http://aiucd2014.unibo.it/book-of-abstracts.pdf en
dc.language.iso ita en
dc.miur.last.status.update 2024-10-11T12:12:27Z *
dc.relation.alleditors Federica Rossi, Francesca Tomasi en
dc.relation.conferencedate 18-19 settembre 2014 en
dc.relation.conferencename AIUCD 3rd annual conference en
dc.relation.conferenceplace Bologna en
dc.relation.ispartofbook La metodologia della ricerca umanistica nell'ecosistema digitale - AIUCD 2014 Terzo convegno annuale en
dc.relation.medium ELETTRONICO en
dc.subject.keywordsita linguistica computazionale, uso linguistico, lessico arabo -
dc.subject.singlekeyword linguistica computazionale *
dc.subject.singlekeyword uso linguistico *
dc.subject.singlekeyword lessico arabo *
dc.title Modelli, metodi e strumenti per il trattamento automatico della lingua araba e per l'editing in ambienti collaborativi en
dc.type.driver info:eu-repo/semantics/conferenceObject -
dc.type.full 04 Contributo in convegno::04.02 Abstract in Atti di convegno it
dc.type.miur 274 -
dc.type.referee Sì, ma tipo non specificato en
dc.ugov.descaux1 288372 -
iris.orcid.lastModifiedDate 2024/11/29 14:52:59 *
iris.orcid.lastModifiedMillisecond 1732888379501 *
iris.sitodocente.maxattempts 1 -
Appare nelle tipologie: 04.02 Abstract in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/230690
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact