Quelques contributions à la sélection de variables et aux tests non-paramétriques

Résumé : Les données du monde réel sont souvent de très grande dimension, faisant intervenir un grand nombre de variables non pertinentes ou redondantes. La sélection de variables est donc utile dans ce cadre. D'abord, on considère la sélection de variables dans le modèle de régression quand le nombre de variables est très grand. En particulier on traite le cas où le nombre de variables pertinentes est bien plus petit que la dimension ambiante. Sans supposer aucune forme paramétrique pour la fonction de régression, on obtient des conditions minimales permettant de retrouver l'ensemble des variables pertinentes. Ces conditions relient la dimension intrinsèque à la dimension ambiante et la taille de l'échantillon. Ensuite, on considère le problème du test d'une hypothèse nulle composite sous un modèle de régression non paramétrique multi varié. Pour une fonctionnelle quadratique donnée $Q$, l'hypothèse nulle correspond au fait que la fonction $f$ satisfait la contrainte $Q[f] = 0$, tandis que l'alternative correspond aux fonctions pour lesquelles $ |Q[f]|$ est minorée par une constante strictement positive. On fournit des taux minimax de test et les constantes de séparation exactes ainsi qu'une procédure optimale exacte, pour des fonctionnelles quadratiques diagonales et positives. On peut utiliser ces résultats pour tester la pertinence d'une ou plusieurs variables explicatives. L'étude des taux minimax pour les fonctionnelles quadratiques diagonales qui ne sont ni positives ni négatives, fait apparaître deux régimes différents : un régime « régulier » et un régime « irrégulier ». On applique ceci au test de l'égalité des normes de deux fonctions observées dans des environnements bruités
Type de document :
Thèse
Mathématiques générales [math.GM]. Université Paris-Est, 2012. Français. <NNT : 2012PEST1068>
Liste complète des métadonnées


https://pastel.archives-ouvertes.fr/pastel-00804979
Contributeur : Abes Star <>
Soumis le : mardi 26 mars 2013 - 17:12:09
Dernière modification le : lundi 26 juin 2017 - 10:12:30
Document(s) archivé(s) le : jeudi 27 juin 2013 - 04:05:23

Fichier

TH2012PEST1068_complete.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : pastel-00804979, version 1

Citation

Laëtitia Comminges. Quelques contributions à la sélection de variables et aux tests non-paramétriques. Mathématiques générales [math.GM]. Université Paris-Est, 2012. Français. <NNT : 2012PEST1068>. <pastel-00804979>

Partager

Métriques

Consultations de
la notice

758

Téléchargements du document

835