Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises

Construction (semi-)automatique d'un lexique sémantique du français : inférences interlinguistiques et morphologie

Ruimy N;
2010

Abstract

Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises
Campo DC Valore Lingua
dc.authority.orgunit Istituto di linguistica computazionale "Antonio Zampolli" - ILC -
dc.authority.people Ruimy N it
dc.authority.people Bouillon P it
dc.authority.people Cartoni B it
dc.authority.people Namer F it
dc.collection.id.s 8c50ea44-be95-498f-946e-7bb5bd666b7c *
dc.collection.name 02.01 Contributo in volume (Capitolo o Saggio) *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/17 13:42:44 -
dc.date.available 2024/02/17 13:42:44 -
dc.date.issued 2010 -
dc.description.abstract Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises -
dc.description.affiliations CNR-ILC, Pisa, Université de Genève, ATILF CNRS-Nancy-Universités -
dc.description.allpeople Ruimy N.; Bouillon P.; Cartoni B.; Namer F. -
dc.description.allpeopleoriginal Ruimy N.; Bouillon P.; Cartoni B.; Namer F. -
dc.description.fulltext none en
dc.description.numberofauthors 1 -
dc.identifier.isbn 978-2-7605-2569-6 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/134820 -
dc.language.iso fre -
dc.publisher.country CAN -
dc.publisher.name Presses de l'Université du Québec -
dc.publisher.place Québec -
dc.relation.alleditors I. Biskri, A. Jebali -
dc.relation.firstpage 71 -
dc.relation.ispartofbook Multilinguisme et traitement des langues naturelles -
dc.relation.lastpage 88 -
dc.relation.numberofpages 17 -
dc.subject.keywords Computational Lexicography -
dc.subject.keywords Computational Morphology -
dc.subject.singlekeyword Computational Lexicography *
dc.subject.singlekeyword Computational Morphology *
dc.title Construction (semi-)automatique d'un lexique sémantique du français : inférences interlinguistiques et morphologie en
dc.type.driver info:eu-repo/semantics/bookPart -
dc.type.full 02 Contributo in Volume::02.01 Contributo in volume (Capitolo o Saggio) it
dc.type.miur 268 -
dc.type.referee Sì, ma tipo non specificato -
dc.ugov.descaux1 136470 -
iris.orcid.lastModifiedDate 2024/03/01 14:52:51 *
iris.orcid.lastModifiedMillisecond 1709301171559 *
iris.sitodocente.maxattempts 1 -
Appare nelle tipologie: 02.01 Contributo in volume (Capitolo o Saggio)
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/134820
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact