Corpus oraux et chunking - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Corpus oraux et chunking

Olivier Blanc
  • Fonction : Auteur
  • PersonId : 921905
Mathieu Constant
Anne Dister
  • Fonction : Auteur
  • PersonId : 861886

Résumé

This paper describes a process of partial parsing of a spontaneous spoken corpus in French. It is based on a preprocessing stage that consists in reformatting and tagging utterances that breaks the syntactic structure of the text. The chunking stage uses large-coverage and fine-grained lexical resources for general language that have been augmented with resources specific to spoken. We show that it reaches a score of 84.1% f-measure.
Fichier principal
Vignette du fichier
blanc_constant_dister_watrin_JEP08.pdf (143.1 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00637677 , version 1 (02-11-2011)

Identifiants

  • HAL Id : hal-00637677 , version 1

Citer

Olivier Blanc, Mathieu Constant, Anne Dister, Patrick Watrin. Corpus oraux et chunking. 27èmes Journées d'Études sur la Parole (JEP'08), 2008, France. pp.4. ⟨hal-00637677⟩
107 Consultations
140 Téléchargements

Partager

Gmail Facebook X LinkedIn More