Skip to Main content Skip to Navigation
Conference papers

Pourquoi les matrices aléatoires expliquent l'apprentissage ? Un argument d'universalité offert par les GANs

Résumé : Afin de mettre enévidence les aspects d'universalité des grandes matrices aléatoires sur les données réelles, nousétudions dans cet article le comportement spectral de la matrice de Gram pour une large classe de vecteurs aléatoires, les dits vecteurs concentrés, qui sont plus riches que des vecteurs gaussiens. L'hypothèse de concentration est particulièrement motivée par le fait que l'on peut générer, grâce aux GANs, des données réalistes par transformations Lipschitziennes de vecteurs gaussiens. En particulier, en générant des imagesà travers un GAN, nous montrons que le comportement spectral de la matrice de Gram est le même sur ces données que sur un modèle de mélange gaussien, rendant ainsi l'estimation des performances de classification prédictibleà travers la théorie des matrices aléatoires pour des données réelles. Abstract-In order to highlight the universality aspects of large random matrices on real data, we study in this paper the spectral behaviour of the Gram matrix for a large class of random vectors, the so-called concentrated vectors, which are richer than Gaussian vectors. The concentration hypothesis is particularly motivated by the fact that realistic data can be generated using GANs by Lipschitzian transformations of Gaussian vectors. Particularly, by generating images across a GAN, we show that the spectral behaviour of the Gram matrix is the same on these data as on a Gaussian mixture model, thereby making the estimation of classification performance predictable through random matrix theory for real data.
Document type :
Conference papers
Complete list of metadata

Cited literature [7 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02971207
Contributor : Mohamed El Amine Seddik Connect in order to contact the contributor
Submitted on : Monday, October 19, 2020 - 12:10:59 PM
Last modification on : Tuesday, October 19, 2021 - 11:25:53 AM
Long-term archiving on: : Wednesday, January 20, 2021 - 6:36:04 PM

File

2019Cgretsi.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02971207, version 1

Citation

Mohamed El Amine Seddik, Mohamed Tamaazousti, Romain Couillet. Pourquoi les matrices aléatoires expliquent l'apprentissage ? Un argument d'universalité offert par les GANs. GRETSI 2019 - XXVIIème Colloque francophone de traitement du signal et des images, Aug 2019, Lille, France. ⟨hal-02971207⟩

Share

Metrics

Record views

72

Files downloads

72