La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale.
Modelli, metodi e strumenti per il trattamento automatico della lingua araba e per l'editing in ambienti collaborativi
Boschetti Federico;Del Gratta Riccardo;Marzi Claudia;Nahli Ouafae;Pirrelli Vito
2014
Abstract
La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale.| Campo DC | Valore | Lingua |
|---|---|---|
| dc.authority.orgunit | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | en |
| dc.authority.people | Boschetti Federico | en |
| dc.authority.people | Del Gratta Riccardo | en |
| dc.authority.people | Marzi Claudia | en |
| dc.authority.people | Nahli Ouafae | en |
| dc.authority.people | Pirrelli Vito | en |
| dc.collection.id.s | 69aaa6b3-f0f0-47c1-b9a1-040bae867ec3 | * |
| dc.collection.name | 04.02 Abstract in Atti di convegno | * |
| dc.contributor.appartenenza | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | * |
| dc.contributor.appartenenza.mi | 918 | * |
| dc.date.accessioned | 2024/02/19 21:13:43 | - |
| dc.date.available | 2024/02/19 21:13:43 | - |
| dc.date.firstsubmission | 2024/09/30 16:30:17 | * |
| dc.date.issued | 2014 | - |
| dc.date.submission | 2024/09/30 16:30:17 | * |
| dc.description.abstractita | La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa: (i) acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi; (ii) sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba; (iii) analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali; (iv) sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet. Queste attività sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale. | - |
| dc.description.affiliations | Institute for Computational Linguistics - National Research Council (ILC-CNR, Pisa) | - |
| dc.description.allpeople | Boschetti, Federico; DEL GRATTA, Riccardo; Marzi, Claudia; Nahli, Ouafae; Pirrelli, Vito | - |
| dc.description.allpeopleoriginal | Boschetti, Federico; Del Gratta, Riccardo; Marzi, Claudia; Nahli, Ouafae; Pirrelli, Vito | en |
| dc.description.fulltext | none | en |
| dc.description.numberofauthors | 5 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.14243/230690 | - |
| dc.identifier.url | http://aiucd2014.unibo.it/book-of-abstracts.pdf | en |
| dc.language.iso | ita | en |
| dc.miur.last.status.update | 2024-10-11T12:12:27Z | * |
| dc.relation.alleditors | Federica Rossi, Francesca Tomasi | en |
| dc.relation.conferencedate | 18-19 settembre 2014 | en |
| dc.relation.conferencename | AIUCD 3rd annual conference | en |
| dc.relation.conferenceplace | Bologna | en |
| dc.relation.ispartofbook | La metodologia della ricerca umanistica nell'ecosistema digitale - AIUCD 2014 Terzo convegno annuale | en |
| dc.relation.medium | ELETTRONICO | en |
| dc.subject.keywordsita | linguistica computazionale, uso linguistico, lessico arabo | - |
| dc.subject.singlekeyword | linguistica computazionale | * |
| dc.subject.singlekeyword | uso linguistico | * |
| dc.subject.singlekeyword | lessico arabo | * |
| dc.title | Modelli, metodi e strumenti per il trattamento automatico della lingua araba e per l'editing in ambienti collaborativi | en |
| dc.type.driver | info:eu-repo/semantics/conferenceObject | - |
| dc.type.full | 04 Contributo in convegno::04.02 Abstract in Atti di convegno | it |
| dc.type.miur | 274 | - |
| dc.type.referee | Sì, ma tipo non specificato | en |
| dc.ugov.descaux1 | 288372 | - |
| iris.orcid.lastModifiedDate | 2024/11/29 14:52:59 | * |
| iris.orcid.lastModifiedMillisecond | 1732888379501 | * |
| iris.sitodocente.maxattempts | 1 | - |
| Appare nelle tipologie: | 04.02 Abstract in Atti di convegno | |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


