Outils multilingues de génération de formes fléchies et dérivées

Résumé : Les dictionnaires électroniques sont l'une des ressources linguistiques de base nécessaires à l'analyse de textes en langue naturelle. Depuis plus de trente ans, des dictionnaires électro-niques dédiés à de nombreuses langues européennes ou non ont vu le jour au sein du LADL dirigé par Maurice Gross. L'élaboration de tels dictionnaires fait appel, dans une première phase, à la collecte des mots simples appartenant à une langue naturelle donnée. Dans une seconde phase, on construit le dictionnaire des formes fléchies associées à chaque mot simple.On utilise pour e faire des outils de flexions dont les premiers, dûs à Blandine Courtois,se servent d'une représentation sous forme de listes de lasses flexionnelles. Plus récemment,d'autres outils sont apparus qui utilisent la notion de transducteur. L'outil que nous proposons, Genflex, permet d'une part de traiter les représentations par listes et leurs variantes(suivant la langue traitée) en y adjoignant une plus grande souplesse d'utilisation grâce à la compatibilité avec la norme Unicode, d'autre part de fournir une passerelle vers l'utilisation de transducteurs via le calcul d'expressions rationnelles associées aux lasses flexionnelles.
Document type :
Reports
Complete list of metadatas

https://hal-upec-upem.archives-ouvertes.fr/hal-01572661
Contributor : Claude Martineau <>
Submitted on : Tuesday, August 8, 2017 - 9:28:38 AM
Last modification on : Wednesday, April 11, 2018 - 12:12:03 PM

Identifiers

  • HAL Id : hal-01572661, version 1

Collections

Citation

Claude Martineau. Outils multilingues de génération de formes fléchies et dérivées. [Rapport de recherche] LIGM - Laboratoire d'Informatique Gaspard-Monge. 2005. ⟨hal-01572661⟩

Share

Metrics

Record views

98