Reported speech detection in newspapers - GREYC monebiom Access content directly
Reports Year : 2023

Reported speech detection in newspapers

Détection de discours rapportés dans les journaux

Abstract

This report describes the work produced at the occasion of the workshop SEEDS (Semaines Études Entreprises en Data Sciences) organized by GdR@MADICS. This workshop was hosted at the University of Troyes (UTT). The industrial project to which we contributed during the workshop was proposed by the association SPOT, and consisted of the detection of reported speech in text extracted from the written press, and the association of such reported speech to a subject. We focused on the French newspaper "Le Parisien", according to the requirement of the association SPOT. The workshop lasted five days, with an introduction session from the industrial product owners, three and a half days of work, and a presentation of the work from all groups on the last day. This report presents the methodology, the contribution, and the results produced during the workshop.
Ce rapport décrit les travaux réalisés à l'occasion de l'atelier SEEDS (Semaines Études Entreprises en Data Sciences) organisé par le GdR@MADICS. Cet atelier a été organisé à l'Université de Troyes (UTT). Le projet industriel auquel nous avons contribué pendant l'atelier était proposé par l'association SPOT, et consistait en la détection de discours rapportés dans des textes extraits de la presse écrite, et l'association de ces discours rapportés à un sujet. Nous nous sommes concentrés sur le journal français "Le Parisien", conformément à la demande de l'association SPOT. L'atelier a duré cinq jours, avec une présentation des responsables du produit, trois jours et demi de travail, et une présentation des travaux de tous les groupes le dernier jour. Ce rapport présente la méthodologie, la contribution et les résultats obtenus au cours de l'atelier.

Keywords

NLP
Fichier principal
Vignette du fichier
Spot_SEEDS23-2.pdf (859.28 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-04227066 , version 1 (10-10-2023)

Licence

Public Domain

Identifiers

  • HAL Id : hal-04227066 , version 1

Cite

Maxence Morin, Lisa Chabrier. Reported speech detection in newspapers. Semaines Études Entreprises en Data Sciences (SEEDS). 2023. ⟨hal-04227066⟩
44 View
37 Download

Share

Gmail Facebook X LinkedIn More