La reconnaissance des mots composés à l'épreuve de l'analyse syntaxique et vice-versa : évaluation de deux stratégies discriminantes - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

La reconnaissance des mots composés à l'épreuve de l'analyse syntaxique et vice-versa : évaluation de deux stratégies discriminantes

Mathieu Constant
Anthony Sigogne
  • Fonction : Auteur
  • PersonId : 764797
  • IdRef : 167754998
Patrick Watrin
  • Fonction : Auteur

Résumé

Nous proposons deux stratégies discriminantes d'intégration des mots composés dans un processus réel d'analyse syntaxique: (i) pré-segmentation lexicale avant analyse, (ii) post-segmentation lexicale après analyse au moyen d'un réordonnanceur. Le segmenteur de l'approche (i) se fonde sur un modèle CRF et permet d'obtenir un reconnaisseur de mots composés {\em état-de-l'art}. Le réordonnanceur de l'approche (ii) repose sur un modèle MaxEnt intégrant des traits dédiés aux mots composés. Nous montrons que les deux approches permettent de combler jusqu'à 18\% de l'écart entre un analyseur {\em baseline} et un analyseur avec segmentation parfaite et jusqu'à 25\% pour la reconnaissance des mots composés.
Fichier principal
Vignette du fichier
constant-sigogne-watrin-vf.pdf (138.9 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00790620 , version 1 (20-02-2013)

Identifiants

  • HAL Id : hal-00790620 , version 1

Citer

Mathieu Constant, Anthony Sigogne, Patrick Watrin. La reconnaissance des mots composés à l'épreuve de l'analyse syntaxique et vice-versa : évaluation de deux stratégies discriminantes. Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2012, France. pp.57--70. ⟨hal-00790620⟩
116 Consultations
310 Téléchargements

Partager

Gmail Facebook X LinkedIn More