M. Constant, I. Tellier, D. Duchier, Y. Dupont, A. Sigogne et al., Intégrer des connaissances linguistiques dans un CRF : application à l " apprentissage d " un segmenteur-étiqueteur du français, 2011.

B. Courtois, Un syst??me de dictionnaires ??lectroniques pour les mots simples du fran??ais, Langue fran??aise, vol.87, issue.1, 1990.
DOI : 10.3406/lfr.1990.6323

B. Courtois, M. Garrigues, G. Gross, M. Gross, R. Jung et al., Dictionnaires électronique DELAC : les mots composés binaires, et Vivès R, 1997.

M. Candito and B. Crabbé, Improving generative statistical parsing with semi-supervised word clustering, Proceedings of the 11th International Conference on Parsing Technologies, IWPT '09, 2009.
DOI : 10.3115/1697236.1697263

URL : https://hal.archives-ouvertes.fr/hal-00495267

A. Dister, M. Francard, G. Geron, V. Giroul, H. Ph et al., Conventions de transcription régissant les corpus de la banque de données VALIBEL, 2006.

A. Dister, De la transcription à l'étiquetage morphosyntaxique. Le cas de la banque de données textuelles orales Valibel, Thèse de doctorat, 2007.

A. Dister, L " autocorrection immédiate en français parlé : le cas des déterminants, 2008.

I. Eshkol, I. Tellier, S. Taalab, and S. Et-billot, Étiqueter un corpus oral par apprentissage automatique à l " aide de connaissances linguistiques, Proc. of JADT'10 (10th International Conference on statistical analysis of textual data), 2010.

S. Green, M. De-marneffe, J. Bauer, and C. D. Et-manning, Multiword Expression Identification with Tree Substitution Grammars: A Parsing tour de force with French, Proc. of EMNLP'11 (Conference on Empirical Methods in Natural Language Processing, 2010.
URL : https://hal.archives-ouvertes.fr/hal-01111383

T. Lavergne, O. Cappé, and . Et-yvon-fr, Practical Very Large Scale CRFs, Proc. of ACL'10 (48 Annual Meeting of the Association for Computational Linguistics, 2010.

B. Pallaud, Les amorces de mots comme faits autonymiques en langage oral. Recherches sur le français parlé, pp.79-101, 2002.
URL : https://hal.archives-ouvertes.fr/hal-00283578

B. Pallaud, La transgression et la variation, Marges Linguistiques, vol.8, pp.76-87, 2004.

S. Paumier, Unitex user manual, 2011.

O. Piton, D. Maurel, and C. Belleil, The Prolex Data Base : Topopnyms and gentiles for NLP, Proc. of NLBD'99 (Third International Workshop on Applications of Natural Language to DataBases, 1999.

C. Ramisch, A. Villavicencio, and C. Boitet, mwetoolkit: a Framework for Multiword Expression Identification, Proc. of LREC'10 (7th International Conference on Language Resources and Evaluation), 2010.
URL : https://hal.archives-ouvertes.fr/hal-00959174

I. A. Sag, T. Baldwin, F. Bond, A. Copestake, and D. Et-flickinger, Multiword Expressions: A Pain in the Neck for NLP, Proc. of CICLING'02 (3rd International Conference on Intelligent Text Processing and Computational Linguistics, 2002.
DOI : 10.1007/3-540-45715-1_1

B. Sagot, The Lefff, a freely available, accurate and large-coverage for French, Proc. of LREC'10 (7 th international conference on Language Resources and Evaluation), 2010.

V. Seretan, L. Nerima, and E. Et-wehrli, Multi-word collocation extraction by syntactic composition of collocation bigrams. Recent Advances in Natural Language Processing III: Selected Papers from RANLP, pp.91-100, 2003.

E. Shriberg, Preliminaries to a Theory of Speech Disfluencies, Thèse non publiée

P. Watrin, . Et-françois, and . Th, An N-gram Frequency Database Reference to Handle MWE Extraction in NLP Applications, Proc. of MWE'11 (ACL Workshop on Multiword Expressions: from Parsing and Generation to the Real World), 2011.