Parole-Simple-Clips (PSC) is a computational lexicon of the Italian language, developed from1996 to 2003 by the Institute of Computational Linguistics of the Italian National ResearchCouncil (ILC-CNR) in the context of national and European projects. The PSC resource isstrongly structured, rich of data, and, for its features, may provide an edge if used in the supportof text retrieval related tasks, such as full-text search. However, the lexicon still appears incompleteand presents some redundant, erroneous and missing data. This paper documents the first stepsundertaken for the creation of LexicO, an Italian computational lexicon built upon PSC startingfrom an in depth analysis of its four linguistic layers (semantic, syntactic, morphological, andphonological) in which it is structured. As a result of this work, LexicO has been released andmade freely available.

Parole-Simple-Clips (PSC) è un lessico computazionale per l'Italiano, sviluppato tra il 1996 e il 2003 presso l'Istituto di Linguistica Computazionale del Consiglio Nazionale delle Ricerche (ILC-CNR) nell'ambito di progetti nazionali ed Europei. PSC è una risorsa ricca, fortemente strutturata e, per le sue caratteristiche, può fornire un vantaggio in task di text retrieval come la ricerca full-text. PSC appare tuttavia incompleta in alcune sue sezioni e presenta dati ridondanti, erronei o mancanti. Questo contributo descrive i primi passi compiuti per la creazione di LexicO, un lessico computazionale italiano costruito sulla base di PSC a partire da un'analisi approfondita dei suoi quattro livelli linguistici (semantico, sintattico, morfologico e fonologico). A seguito di questi interventi, LexicO è stato rilasciato e reso liberamente disponibile.

LexicO: an Italian Computational Lexicon derived from Parole- Simple-Clips

Sciolette Flavia;Marchi Simone;Giovannetti Emiliano
2023

Abstract

Parole-Simple-Clips (PSC) is a computational lexicon of the Italian language, developed from1996 to 2003 by the Institute of Computational Linguistics of the Italian National ResearchCouncil (ILC-CNR) in the context of national and European projects. The PSC resource isstrongly structured, rich of data, and, for its features, may provide an edge if used in the supportof text retrieval related tasks, such as full-text search. However, the lexicon still appears incompleteand presents some redundant, erroneous and missing data. This paper documents the first stepsundertaken for the creation of LexicO, an Italian computational lexicon built upon PSC startingfrom an in depth analysis of its four linguistic layers (semantic, syntactic, morphological, andphonological) in which it is structured. As a result of this work, LexicO has been released andmade freely available.
2023
Istituto di linguistica computazionale "Antonio Zampolli" - ILC
Parole-Simple-Clips (PSC) è un lessico computazionale per l'Italiano, sviluppato tra il 1996 e il 2003 presso l'Istituto di Linguistica Computazionale del Consiglio Nazionale delle Ricerche (ILC-CNR) nell'ambito di progetti nazionali ed Europei. PSC è una risorsa ricca, fortemente strutturata e, per le sue caratteristiche, può fornire un vantaggio in task di text retrieval come la ricerca full-text. PSC appare tuttavia incompleta in alcune sue sezioni e presenta dati ridondanti, erronei o mancanti. Questo contributo descrive i primi passi compiuti per la creazione di LexicO, un lessico computazionale italiano costruito sulla base di PSC a partire da un'analisi approfondita dei suoi quattro livelli linguistici (semantico, sintattico, morfologico e fonologico). A seguito di questi interventi, LexicO è stato rilasciato e reso liberamente disponibile.
Computational Lexicon
Parole-Simple-Clips
Linguistic Resources
Full-text Search
LexicO
File in questo prodotto:
File Dimensione Formato  
15176-sciolette.pdf

accesso aperto

Tipologia: Versione Editoriale (PDF)
Licenza: Creative commons
Dimensione 697.4 kB
Formato Adobe PDF
697.4 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/462840
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 1
  • ???jsp.display-item.citation.isi??? ND
social impact