Compression de texte à base de mots à l'aide de l'algorithme de Ziv, Lempel et Welch

Claude Martineau

Rapport (Rapport De Recherche) Année : 1996

Compression de texte à base de mots à l'aide de l'algorithme de Ziv, Lempel et Welch

(1)

Claude Martineau

Fonction : Auteur
PersonId : 1497
IdHAL : claude-martineau

Laboratoire d'Informatique Gaspard-Monge

Résumé

Nous étudions dans cet article plusieurs possibilités d'adapter l'algorithme de compression de données LZW à la compression de texte en langue naturelle. Ce type de compression considère le texte comme une suite alternée de mots d'une langue donnée et de mots de ponctuations: l'unité de base de traitement est alors le mot. Nous considérons des adaptations de l'algorithme de LZW nécessitant pour certaines une lecture du texte, pour d'autres deux lectures du texte tout en privilégiant l'étude de celles à une lecture dans le souci de garder à cet algorithme sa rapidité d'origine. Les résultats montrent que ces algorithmes ont des taux de compression nettement supérieurs à ceux que l'on obtient avec les algorithmes le plus couramment utilisés que sont compress et gzip. Ils permettent en effet d'obtenir des taux de compression de 30% à 35% tout en gardant une grande rapidité.

Mots clés

compression de texte Ziv Lempel et Welch à base de mots

Domaines

Informatique [cs]

Claude Martineau : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01572640

Soumis le : mardi 8 août 2017-07:50:40

Dernière modification le : jeudi 28 mars 2024-03:27:59

Dates et versions

hal-01572640 , version 1 (08-08-2017)

Identifiants

HAL Id : hal-01572640 , version 1

Citer

Claude Martineau. Compression de texte à base de mots à l'aide de l'algorithme de Ziv, Lempel et Welch. [Rapport de recherche] 96-34, LIGM - Laboratoire d'Informatique Gaspard-Monge. 1996. ⟨hal-01572640⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENPC CNRS LIGM_LINGU PARISTECH LIGM LARA UNIV-EIFFEL JSE2024

86 Consultations

0 Téléchargements

Compression de texte à base de mots à l'aide de l'algorithme de Ziv, Lempel et Welch

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager