CLIPS est la plus vaste ressource lexicale électronique de l'italien. Elle comprend 55.000 mots codés à 4 niveaux de description linguistique. La représentation lexicale est basée sur des standards internationaux: CLIPS utilise en effet le même modèle, le même langage de représentation et la même méthodologie que 11 autres lexiques développés au cours des projets européens PAROLE et SIMPLE. Les informations fournies, particulièrement utiles pour des applications de TLH, sont très structurées, granulaires et innovatrices, avec entre autres au niveau sémantique la Extended Qualia Structure, basée sur la théorie du Lexique Génératif, et la représentation prédicative. La description d'une unité lexicale est un continuum à travers les différents niveaux d'information. Les propriétés phonologiques, morphologiques et syntaxiques d'un lemme, ainsi que son/ses schéma(s) d'arguments sont décrits. Au niveau sémantique, chaque lexème/sens est associé à un vaste ensemble structuré d'informations, parmi lesquelles son type ontologique et l'expression - au moyen des relations qualia - des différentes facettes de sa sémantique. La représentation prédicative décrit, quant à elle, le scénario sémantique (dans lequel le mot s'insère) et ses participants auxquels sont attribués rôle thématique et contraintes sémantiques. La relation des niveaux syntaxique et sémantique est assurée par des liens permettant de projeter les structures argumentales sur leur(s) réalisation(s) syntaxique(s). Une telle richesse d'information, et en particulier celle fournie par la Extended Qualia, permet notamment 1) de constituer des réseaux sémantiques, en formulant une requête sur l'ensemble des relations qualia contenant un mot-clé ; 2) d'extraire des noyaux de vocabulaire de domaines spécifiques, en alternant requêtes sur qualia et sens ; 3) d'acquérir des collocations lexicales, en exploitant les liens syntagmatiques évènements/entités exprimés par les qualia ; 4) de désambiguïser la contribution sémantique du modificateur dans certains groupes nominaux complexes, en analysant la structure qualia de la tête.

Un lexique électronique multi-niveaux de l'italien

Ruimy N;Monachini M;
2003

Abstract

CLIPS est la plus vaste ressource lexicale électronique de l'italien. Elle comprend 55.000 mots codés à 4 niveaux de description linguistique. La représentation lexicale est basée sur des standards internationaux: CLIPS utilise en effet le même modèle, le même langage de représentation et la même méthodologie que 11 autres lexiques développés au cours des projets européens PAROLE et SIMPLE. Les informations fournies, particulièrement utiles pour des applications de TLH, sont très structurées, granulaires et innovatrices, avec entre autres au niveau sémantique la Extended Qualia Structure, basée sur la théorie du Lexique Génératif, et la représentation prédicative. La description d'une unité lexicale est un continuum à travers les différents niveaux d'information. Les propriétés phonologiques, morphologiques et syntaxiques d'un lemme, ainsi que son/ses schéma(s) d'arguments sont décrits. Au niveau sémantique, chaque lexème/sens est associé à un vaste ensemble structuré d'informations, parmi lesquelles son type ontologique et l'expression - au moyen des relations qualia - des différentes facettes de sa sémantique. La représentation prédicative décrit, quant à elle, le scénario sémantique (dans lequel le mot s'insère) et ses participants auxquels sont attribués rôle thématique et contraintes sémantiques. La relation des niveaux syntaxique et sémantique est assurée par des liens permettant de projeter les structures argumentales sur leur(s) réalisation(s) syntaxique(s). Une telle richesse d'information, et en particulier celle fournie par la Extended Qualia, permet notamment 1) de constituer des réseaux sémantiques, en formulant une requête sur l'ensemble des relations qualia contenant un mot-clé ; 2) d'extraire des noyaux de vocabulaire de domaines spécifiques, en alternant requêtes sur qualia et sens ; 3) d'acquérir des collocations lexicales, en exploitant les liens syntagmatiques évènements/entités exprimés par les qualia ; 4) de désambiguïser la contribution sémantique du modificateur dans certains groupes nominaux complexes, en analysant la structure qualia de la tête.
2003
Istituto di linguistica computazionale "Antonio Zampolli" - ILC
80-86732-21-5
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/431276
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact