Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises
Construction (semi-)automatique d'un lexique sémantique du français : inférences interlinguistiques et morphologie
Ruimy N;
2010
Abstract
Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises| Campo DC | Valore | Lingua |
|---|---|---|
| dc.authority.orgunit | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | - |
| dc.authority.people | Ruimy N | it |
| dc.authority.people | Bouillon P | it |
| dc.authority.people | Cartoni B | it |
| dc.authority.people | Namer F | it |
| dc.collection.id.s | 8c50ea44-be95-498f-946e-7bb5bd666b7c | * |
| dc.collection.name | 02.01 Contributo in volume (Capitolo o Saggio) | * |
| dc.contributor.appartenenza | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | * |
| dc.contributor.appartenenza.mi | 918 | * |
| dc.date.accessioned | 2024/02/17 13:42:44 | - |
| dc.date.available | 2024/02/17 13:42:44 | - |
| dc.date.issued | 2010 | - |
| dc.description.abstract | Nous décrivons deux méthodes complémentaires pour la dérivation semi-automatique d'un lexique du français, suivant le modèle du Lexique Génératif. La première méthode exploite la similitude entre les langues. Les informations lexicales françaises sont dérivées à partir d'un dictionnaire sémantique électronique de l'italien. À cet effet, nous combinons 2 stratégies :pour les mots construits, nous exploitons la cognacité de certains suffixes. Après avoir recherché dans un dictionnaire bilingue la traduction française du mot italien avec le suffixe français correspondant (ex. : costruzione ? construction), nous générons l'entrée lexicale française en y transférant les informations sémantiques de l'entrée italienne ; . pour les mots non construits polysémiques (ex. : frazione [fraction, hameau]), nous utilisons les indicateurs de sens fournis dans les dictionnaires bilingues (pour frazione: (mat.); (centro abitato)) de manière à identifier, dans le lexique électronique italien, l'entrée lexicale appropriée qui donnera naissance à l'entrée du sens français équivalent. La seconde méthode fait appel aux principes de la morphologie constructionnelle du français et permet potentiellement de coder des mots construits dont les équivalents italiens ne figurent pas dans le lexique source. Ces mots nouveaux, extraits de corpus, sont soumis à l'analyseur dérivationnel DériF dont le résultat fournit une grande partie de l'information lexicale permettant la construction de nouvelles entrées françaises | - |
| dc.description.affiliations | CNR-ILC, Pisa, Université de Genève, ATILF CNRS-Nancy-Universités | - |
| dc.description.allpeople | Ruimy N.; Bouillon P.; Cartoni B.; Namer F. | - |
| dc.description.allpeopleoriginal | Ruimy N.; Bouillon P.; Cartoni B.; Namer F. | - |
| dc.description.fulltext | none | en |
| dc.description.numberofauthors | 1 | - |
| dc.identifier.isbn | 978-2-7605-2569-6 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.14243/134820 | - |
| dc.language.iso | fre | - |
| dc.publisher.country | CAN | - |
| dc.publisher.name | Presses de l'Université du Québec | - |
| dc.publisher.place | Québec | - |
| dc.relation.alleditors | I. Biskri, A. Jebali | - |
| dc.relation.firstpage | 71 | - |
| dc.relation.ispartofbook | Multilinguisme et traitement des langues naturelles | - |
| dc.relation.lastpage | 88 | - |
| dc.relation.numberofpages | 17 | - |
| dc.subject.keywords | Computational Lexicography | - |
| dc.subject.keywords | Computational Morphology | - |
| dc.subject.singlekeyword | Computational Lexicography | * |
| dc.subject.singlekeyword | Computational Morphology | * |
| dc.title | Construction (semi-)automatique d'un lexique sémantique du français : inférences interlinguistiques et morphologie | en |
| dc.type.driver | info:eu-repo/semantics/bookPart | - |
| dc.type.full | 02 Contributo in Volume::02.01 Contributo in volume (Capitolo o Saggio) | it |
| dc.type.miur | 268 | - |
| dc.type.referee | Sì, ma tipo non specificato | - |
| dc.ugov.descaux1 | 136470 | - |
| iris.orcid.lastModifiedDate | 2024/03/01 14:52:51 | * |
| iris.orcid.lastModifiedMillisecond | 1709301171559 | * |
| iris.sitodocente.maxattempts | 1 | - |
| Appare nelle tipologie: | 02.01 Contributo in volume (Capitolo o Saggio) | |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


