Stratégies discriminantes pour intégrer la reconnaissance des mots composés dans un analyseur syntaxique en constituants

Mathieu Constant; Anthony Sigogne; Patrick Watrin

Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2013

Stratégies discriminantes pour intégrer la reconnaissance des mots composés dans un analyseur syntaxique en constituants

(1) , (1) , (2)

1
2

Mathieu Constant

Fonction : Auteur
PersonId : 19722
IdHAL : constant-mathieu
IdRef : 158098188

Laboratoire d'Informatique Gaspard-Monge

Anthony Sigogne

Fonction : Auteur
PersonId : 764797
IdRef : 167754998

Laboratoire d'Informatique Gaspard-Monge

Patrick Watrin

Fonction : Auteur

Cental

Résumé

Nous proposons deux stratégies discriminantes d'intégration des mots composés dans un processus d'analyse syntaxique en constituants: (i) pré-segmentation lexicale avant analyse, (ii) post-segmentation lexicale après analyse au moyen d'un réordonnanceur. Le segmenteur de l'approche (i) se fonde sur les champs aléatoires markoviens. Le réordonnanceur de l'approche (ii) repose sur un modèle maximum d'entropie. Tous ces modèles intègrent des traits dédiés aux mots composés, dont certains sont calculés à partir de ressources lexicales externes. Nous montrons que l'approche par pré-segmentation atteint des performances dépassant l'état-de-l'art, alors que celle par post-segmentation sont un peu en-dessous de nos espérances. Les différentes expériences menées ouvrent de nombreuses pistes de recherche.

Mots clés

Mots composés analyse syntaxique champs markoviens aléatoires réordonnanceur

Domaines

Traitement du texte et du document

Matthieu Constant : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00846888

Soumis le : lundi 22 juillet 2013-10:30:41

Dernière modification le : jeudi 28 mars 2024-03:28:16

Dates et versions

hal-00846888 , version 1 (22-07-2013)

Identifiants

HAL Id : hal-00846888 , version 1

Citer

Mathieu Constant, Anthony Sigogne, Patrick Watrin. Stratégies discriminantes pour intégrer la reconnaissance des mots composés dans un analyseur syntaxique en constituants. Revue TAL : traitement automatique des langues, 2013, 54 (1), pp.47-70. ⟨hal-00846888⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENPC CNRS UNIV-MLV LIGM_LINGU PARISTECH LIGM LIGM_MOA ESIEE-PARIS UNIV-EIFFEL LIGM_ADA JSE2024

76 Consultations

0 Téléchargements

Stratégies discriminantes pour intégrer la reconnaissance des mots composés dans un analyseur syntaxique en constituants

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager