Extraction de citations contenues dans des documents brevet

Résumé : Le présent article s'inscrit dans une démarche générale d'élaboration d'outils et de méthodes d'analyse permettant de caractériser les activités scientifiques et techniques. Le nombre de publications scientifiques numériques est de plus en plus important. Nous nous intéressons plus particulièrement ici au repérage et à l'extraction automatique de citations et de références contenues dans des documents, en anglais, de type brevet d'inventions. La méthode utilisée repose sur une approche symbolique qui fait appel à la création et l'utilisation combinée de dictionnaires électroniques et de grammaires locales. L'outil de traitement de corpus Unitex est utilisé pour l'élaboration et l'application de ces ressources linguistiques à un corpus d'étude.
Document type :
Conference papers
Complete list of metadatas

Cited literature [9 references]  Display  Hide  Download

https://hal-upec-upem.archives-ouvertes.fr/hal-01090581
Contributor : Claude Martineau <>
Submitted on : Wednesday, December 3, 2014 - 5:32:02 PM
Last modification on : Sunday, February 10, 2019 - 5:32:02 PM
Long-term archiving on : Monday, March 9, 2015 - 5:52:12 AM

File

Extraction_Citations_LGC_2013....
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01090581, version 1

Citation

Eleni Kogkitsidou, Tita Kyriacopoulou, Claude Martineau, Cristian Martinez, A-Young Kim, et al.. Extraction de citations contenues dans des documents brevet. 32ème colloque international sur le lexique et la grammaire, Sep 2013, Faro, Portugal. pp.57-64. ⟨hal-01090581⟩

Share

Metrics

Record views

360

Files downloads

425