Extraction de « segments complexes » : enrichissement des dictionnaires

Résumé : Cette étude porte sur l’enrichissement et la maintenance des dictionnaires électroniques à travers la reconnaissance de « segments complexes ». Après une définition explicite des « segments complexes » nous présentons l’approche adoptée qui consiste à capter des séquences composées de multi-mots qui sont absentes des dictionnaires à l’aide de grammaires locales appelées graphe dictionnaire et de créer le dictionnaire du texte. Cette méthode réalisable dans l’environnement Unitex nous permet d’enrichir les dictionnaires, en produisant notamment de nouvelles entrées, et donne la possibilité de construire des grammaires « expertes » aisément réutilisables.
Document type :
Journal articles
Complete list of metadatas

https://hal-upec-upem.archives-ouvertes.fr/hal-01448686
Contributor : Claude Martineau <>
Submitted on : Saturday, January 28, 2017 - 5:26:13 PM
Last modification on : Friday, July 13, 2018 - 3:54:02 PM

Identifiers

  • HAL Id : hal-01448686, version 1

Citation

Tita Kyriacopoulou, Claude Martineau. Extraction de « segments complexes » : enrichissement des dictionnaires. Études de linguistique appliquée : revue de didactologie des langues-cultures, Klincksieck (Didier Erudition jusqu'en 2003), 2015, Linguistique et informatique, octobre-décembre 2015 (180), pp.407-416. ⟨hal-01448686⟩

Share

Metrics

Record views

189