Skip to Main content Skip to Navigation
Conference papers

La reconnaissance des mots composés à l'épreuve de l'analyse syntaxique et vice-versa : évaluation de deux stratégies discriminantes

Résumé : Nous proposons deux stratégies discriminantes d'intégration des mots composés dans un processus réel d'analyse syntaxique: (i) pré-segmentation lexicale avant analyse, (ii) post-segmentation lexicale après analyse au moyen d'un réordonnanceur. Le segmenteur de l'approche (i) se fonde sur un modèle CRF et permet d'obtenir un reconnaisseur de mots composés {\em état-de-l'art}. Le réordonnanceur de l'approche (ii) repose sur un modèle MaxEnt intégrant des traits dédiés aux mots composés. Nous montrons que les deux approches permettent de combler jusqu'à 18\% de l'écart entre un analyseur {\em baseline} et un analyseur avec segmentation parfaite et jusqu'à 25\% pour la reconnaissance des mots composés.
Document type :
Conference papers
Complete list of metadata

Cited literature [22 references]  Display  Hide  Download

https://hal-upec-upem.archives-ouvertes.fr/hal-00790620
Contributor : Matthieu Constant Connect in order to contact the contributor
Submitted on : Wednesday, February 20, 2013 - 3:53:59 PM
Last modification on : Tuesday, October 19, 2021 - 11:26:19 AM
Long-term archiving on: : Tuesday, May 21, 2013 - 9:26:59 AM

File

constant-sigogne-watrin-vf.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00790620, version 1

Citation

Mathieu Constant, Anthony Sigogne, Patrick Watrin. La reconnaissance des mots composés à l'épreuve de l'analyse syntaxique et vice-versa : évaluation de deux stratégies discriminantes. Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2012, France. pp.57--70. ⟨hal-00790620⟩

Share

Metrics

Record views

310

Files downloads

364