Using Grammatical Inference for Structure Induction in Practical Text Mining Process - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Using Grammatical Inference for Structure Induction in Practical Text Mining Process

Alexandre Saidi

Résumé

Given the huge quantity of the current available textual information, text mining process tackles the task of searching useful knowledge in a natural language document. When dealing with a free-format textual corpus (e.g. a job announcement) where the linguistic rules are not respected, the time consuming morpho-syntactic analysis is not of a great help. However, text mining techniques process may exploit linguistic sub-structures in the text. In this paper, we present an applications of grammatical inference (GI) in a machine learning system applied to a text corpus. We specify and use the process of the grammatical inference as an instance of the constraint satisfaction problem that instantiates automata in a (language inclusion) lattice
Etant donné la quantité importante de documents textuels disponibles, le processus de Text Mining se fixe la tâche de rechercher des connaissances utiles dans un document en langage naturel. Lorsqu'il s'agit d'un corpus au format libre (par exemple, une annonce d'emploi) où les règles linguistiques ne sont pas respectées, l'analyse morpho-syntaxique n'est pas d'un grand secours. Toutefois, les techniques de Text Mining peuvent exploiter les sous-structures linguistiques dans le texte. Dans cet article, nous présentons une des applications d'Inférence Grammaticale (GI) dans un système d'apprentissage automatique appliqué à un corpus de textes. Nous précisons le processus et l'utilisation de l'inférence grammaticale comme une instance du problème de satisfaction de contraintes instanciant un automate dans un treillis d'automates.
Fichier principal
Vignette du fichier
Saidi2006.pdf (223.11 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01614154 , version 1 (19-11-2022)

Licence

Paternité

Identifiants

Citer

Alexandre Saidi. Using Grammatical Inference for Structure Induction in Practical Text Mining Process. 15th International Conference on Computing (CIC'06), Nov 2006, Mexico, Mexico. pp.92-104, ⟨10.1109/CIC.2006.71⟩. ⟨hal-01614154⟩
357 Consultations
26 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More