CLIPS est la plus vaste ressource lexicale électronique de l'italien. Elle comprend 55.000 mots codés à 4 niveaux de description linguistique. La représentation lexicale est basée sur des standards internationaux: CLIPS utilise en effet le même modèle, le même langage de représentation et la même méthodologie que 11 autres lexiques développés au cours des projets européens PAROLE et SIMPLE. Les informations fournies, particulièrement utiles pour des applications de TLH, sont très structurées, granulaires et innovatrices, avec entre autres au niveau sémantique la Extended Qualia Structure, basée sur la théorie du Lexique Génératif, et la représentation prédicative. La description d'une unité lexicale est un continuum à travers les différents niveaux d'information. Les propriétés phonologiques, morphologiques et syntaxiques d'un lemme, ainsi que son/ses schéma(s) d'arguments sont décrits. Au niveau sémantique, chaque lexème/sens est associé à un vaste ensemble structuré d'informations, parmi lesquelles son type ontologique et l'expression - au moyen des relations qualia - des différentes facettes de sa sémantique. La représentation prédicative décrit, quant à elle, le scénario sémantique (dans lequel le mot s'insère) et ses participants auxquels sont attribués rôle thématique et contraintes sémantiques. La relation des niveaux syntaxique et sémantique est assurée par des liens permettant de projeter les structures argumentales sur leur(s) réalisation(s) syntaxique(s). Une telle richesse d'information, et en particulier celle fournie par la Extended Qualia, permet notamment 1) de constituer des réseaux sémantiques, en formulant une requête sur l'ensemble des relations qualia contenant un mot-clé ; 2) d'extraire des noyaux de vocabulaire de domaines spécifiques, en alternant requêtes sur qualia et sens ; 3) d'acquérir des collocations lexicales, en exploitant les liens syntagmatiques évènements/entités exprimés par les qualia ; 4) de désambiguïser la contribution sémantique du modificateur dans certains groupes nominaux complexes, en analysant la structure qualia de la tête.

Un lexique électronique multi-niveaux de l'italien

Ruimy N;Monachini M;
2003

Abstract

CLIPS est la plus vaste ressource lexicale électronique de l'italien. Elle comprend 55.000 mots codés à 4 niveaux de description linguistique. La représentation lexicale est basée sur des standards internationaux: CLIPS utilise en effet le même modèle, le même langage de représentation et la même méthodologie que 11 autres lexiques développés au cours des projets européens PAROLE et SIMPLE. Les informations fournies, particulièrement utiles pour des applications de TLH, sont très structurées, granulaires et innovatrices, avec entre autres au niveau sémantique la Extended Qualia Structure, basée sur la théorie du Lexique Génératif, et la représentation prédicative. La description d'une unité lexicale est un continuum à travers les différents niveaux d'information. Les propriétés phonologiques, morphologiques et syntaxiques d'un lemme, ainsi que son/ses schéma(s) d'arguments sont décrits. Au niveau sémantique, chaque lexème/sens est associé à un vaste ensemble structuré d'informations, parmi lesquelles son type ontologique et l'expression - au moyen des relations qualia - des différentes facettes de sa sémantique. La représentation prédicative décrit, quant à elle, le scénario sémantique (dans lequel le mot s'insère) et ses participants auxquels sont attribués rôle thématique et contraintes sémantiques. La relation des niveaux syntaxique et sémantique est assurée par des liens permettant de projeter les structures argumentales sur leur(s) réalisation(s) syntaxique(s). Une telle richesse d'information, et en particulier celle fournie par la Extended Qualia, permet notamment 1) de constituer des réseaux sémantiques, en formulant une requête sur l'ensemble des relations qualia contenant un mot-clé ; 2) d'extraire des noyaux de vocabulaire de domaines spécifiques, en alternant requêtes sur qualia et sens ; 3) d'acquérir des collocations lexicales, en exploitant les liens syntagmatiques évènements/entités exprimés par les qualia ; 4) de désambiguïser la contribution sémantique du modificateur dans certains groupes nominaux complexes, en analysant la structure qualia de la tête.
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC -
dc.authority.people Ruimy N it
dc.authority.people Monachini M it
dc.authority.people Calzolari N it
dc.collection.id.s 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d *
dc.collection.name 04.01 Contributo in Atti di convegno *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/20 08:20:33 -
dc.date.available 2024/02/20 08:20:33 -
dc.date.issued 2003 -
dc.description.abstract CLIPS est la plus vaste ressource lexicale électronique de l'italien. Elle comprend 55.000 mots codés à 4 niveaux de description linguistique. La représentation lexicale est basée sur des standards internationaux: CLIPS utilise en effet le même modèle, le même langage de représentation et la même méthodologie que 11 autres lexiques développés au cours des projets européens PAROLE et SIMPLE. Les informations fournies, particulièrement utiles pour des applications de TLH, sont très structurées, granulaires et innovatrices, avec entre autres au niveau sémantique la Extended Qualia Structure, basée sur la théorie du Lexique Génératif, et la représentation prédicative. La description d'une unité lexicale est un continuum à travers les différents niveaux d'information. Les propriétés phonologiques, morphologiques et syntaxiques d'un lemme, ainsi que son/ses schéma(s) d'arguments sont décrits. Au niveau sémantique, chaque lexème/sens est associé à un vaste ensemble structuré d'informations, parmi lesquelles son type ontologique et l'expression - au moyen des relations qualia - des différentes facettes de sa sémantique. La représentation prédicative décrit, quant à elle, le scénario sémantique (dans lequel le mot s'insère) et ses participants auxquels sont attribués rôle thématique et contraintes sémantiques. La relation des niveaux syntaxique et sémantique est assurée par des liens permettant de projeter les structures argumentales sur leur(s) réalisation(s) syntaxique(s). Une telle richesse d'information, et en particulier celle fournie par la Extended Qualia, permet notamment 1) de constituer des réseaux sémantiques, en formulant une requête sur l'ensemble des relations qualia contenant un mot-clé ; 2) d'extraire des noyaux de vocabulaire de domaines spécifiques, en alternant requêtes sur qualia et sens ; 3) d'acquérir des collocations lexicales, en exploitant les liens syntagmatiques évènements/entités exprimés par les qualia ; 4) de désambiguïser la contribution sémantique du modificateur dans certains groupes nominaux complexes, en analysant la structure qualia de la tête. -
dc.description.affiliations Istituto di Linguistica Computazionale "Antonio Zampolli" - CNR, Pisa -
dc.description.allpeople Ruimy, N; Monachini, M; Calzolari, N -
dc.description.allpeopleoriginal Ruimy N., Monachini M., Calzolari N. -
dc.description.fulltext none en
dc.description.numberofauthors 3 -
dc.identifier.isbn 80-86732-21-5 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/431276 -
dc.language.iso fre -
dc.relation.conferencedate 24-29 Luglio 2003 -
dc.relation.conferencename CIL XVII International Congress of Linguists -
dc.relation.conferenceplace Prague -
dc.relation.firstpage 1 -
dc.relation.lastpage 10 -
dc.title Un lexique électronique multi-niveaux de l'italien en
dc.type.driver info:eu-repo/semantics/conferenceObject -
dc.type.full 04 Contributo in convegno::04.01 Contributo in Atti di convegno it
dc.type.miur 273 -
dc.type.referee Sì, ma tipo non specificato -
dc.ugov.descaux1 84563 -
iris.orcid.lastModifiedDate 2024/04/04 14:39:00 *
iris.orcid.lastModifiedMillisecond 1712234340032 *
iris.sitodocente.maxattempts 1 -
Appare nelle tipologie: 04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/431276
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact