Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises

Construction (semi-)automatique d'un lexique sémantique du français : inférences interlinguistiques et morphologie

Ruimy N;
2010

Abstract

Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises
2010
Istituto di linguistica computazionale "Antonio Zampolli" - ILC
978-2-7605-2569-6
Computational Lexicography
Computational Morphology
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/134820
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact