Le modèle lexical SIMPLE que nous nous proposons d'adopter pour la création d'un thésaurus-lexique de la terminologie linguistique saussurienne a été créé dans le cadre du projet européen éponyme et a permis le développement de lexiques sémantiques monolingues harmonisés pour douze langues de l'Union Européenne. Dès sa création, il s'est imposé comme standard de facto et a ainsi inspiré de manière déterminante le standard international ISO pour les lexiques du Traitement Automatique des Langues. Dans le panorama de la Lexicographie Computationnelle, ce modèle lexical se distingue par certains aspects particulièrement novateurs. L'approche théorique adoptée pour la représentation de l'information sémantique est basée sur les principes fondamentaux de la théorie du Lexique Génératif (J. Pustejovsky, 1995 ; 2001 ). L'architecture flexible du modèle ainsi que la méthodologie de construction du lexique permettent d'encoder dans les entrées lexicales une ample gamme d'informations hautement structurées couvrant tous les aspects de la sémantique lexicale des mots ; ceci de manière cohérente, et au degré de granularité souhaité. La structuration conceptuelle du lexique est confiée à une ontologie linguistique mettant en relief le caractère multidimensionnel du sens lexical. L'ontologie SIMPLE est formée de types sémantiques indépendants des langues et a été conçue en prévision d'expansions ou de spécialisations visant à satisfaire aux exigences de domaines d'intérêt particuliers. Outre la classification ontologique et un certain nombre de traits sémantiques, les unités lexicales sont caractérisées par un réseau de relations sémantiques qui sont en majeure partie le fruit d'une relecture de la structure des qualia que Pustejovsky emprunte à Moravcsik, 1975 . Ces relations permettent de modéliser l'information concernant les différentes composantes sémantiques qui concourent à définir la structure interne d'une unité lexicale. Elles explicitent ses liens hyperonymiques et méronymiques mais aussi, sur l'axe syntagmatique, les liens aux différents prédicats qui contribuent à éclairer son sens, et en particulier l'origine et la fonction de l'entité dénotée. D'autres relations, telles que la synonymie, la polysémie logique et la dérivation morphologique sont également définies. Les lexèmes prédicatifs, et en particulier les verbes, sont de surcroît caractérisés par le scénario sémantique dans lequel ils sont impliqués. Celui-ci est décrit en termes de classe aspectuelle et de structure argumentale du prédicat, avec indication du rôle sémantique et des restrictions de sélection de chacun des arguments.

Modèle lexical pour un thésaurus-lexique électronique de la terminologie saussurienne

Ruimy N;Bozzi A;Pardelli G
2009

Abstract

Le modèle lexical SIMPLE que nous nous proposons d'adopter pour la création d'un thésaurus-lexique de la terminologie linguistique saussurienne a été créé dans le cadre du projet européen éponyme et a permis le développement de lexiques sémantiques monolingues harmonisés pour douze langues de l'Union Européenne. Dès sa création, il s'est imposé comme standard de facto et a ainsi inspiré de manière déterminante le standard international ISO pour les lexiques du Traitement Automatique des Langues. Dans le panorama de la Lexicographie Computationnelle, ce modèle lexical se distingue par certains aspects particulièrement novateurs. L'approche théorique adoptée pour la représentation de l'information sémantique est basée sur les principes fondamentaux de la théorie du Lexique Génératif (J. Pustejovsky, 1995 ; 2001 ). L'architecture flexible du modèle ainsi que la méthodologie de construction du lexique permettent d'encoder dans les entrées lexicales une ample gamme d'informations hautement structurées couvrant tous les aspects de la sémantique lexicale des mots ; ceci de manière cohérente, et au degré de granularité souhaité. La structuration conceptuelle du lexique est confiée à une ontologie linguistique mettant en relief le caractère multidimensionnel du sens lexical. L'ontologie SIMPLE est formée de types sémantiques indépendants des langues et a été conçue en prévision d'expansions ou de spécialisations visant à satisfaire aux exigences de domaines d'intérêt particuliers. Outre la classification ontologique et un certain nombre de traits sémantiques, les unités lexicales sont caractérisées par un réseau de relations sémantiques qui sont en majeure partie le fruit d'une relecture de la structure des qualia que Pustejovsky emprunte à Moravcsik, 1975 . Ces relations permettent de modéliser l'information concernant les différentes composantes sémantiques qui concourent à définir la structure interne d'une unité lexicale. Elles explicitent ses liens hyperonymiques et méronymiques mais aussi, sur l'axe syntagmatique, les liens aux différents prédicats qui contribuent à éclairer son sens, et en particulier l'origine et la fonction de l'entité dénotée. D'autres relations, telles que la synonymie, la polysémie logique et la dérivation morphologique sont également définies. Les lexèmes prédicatifs, et en particulier les verbes, sont de surcroît caractérisés par le scénario sémantique dans lequel ils sont impliqués. Celui-ci est décrit en termes de classe aspectuelle et de structure argumentale du prédicat, avec indication du rôle sémantique et des restrictions de sélection de chacun des arguments.
2009
Istituto di linguistica computazionale "Antonio Zampolli" - ILC
Computational Lexicon
Thesaurus
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/106752
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact