INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï



Documents pareils
Chapitre 3 : Fonctions d une variable réelle (1)

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

1 Mesure et intégrale

Limites des Suites numériques

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Statistique descriptive bidimensionnelle

Séries réelles ou complexes

Etude de la fonction ζ de Riemann

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

CHAPITRE 2 SÉRIES ENTIÈRES

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

14 Chapitre 14. Théorème du point fixe

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

STATISTIQUE : TESTS D HYPOTHESES

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

20. Algorithmique & Mathématiques

Processus et martingales en temps continu

Séquence 5. La fonction logarithme népérien. Sommaire

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

4 Approximation des fonctions

SÉRIES STATISTIQUES À DEUX VARIABLES

Suites et séries de fonctions

STATISTIQUE AVANCÉE : MÉTHODES

Processus géométrique généralisé et applications en fiabilité

Les Nombres Parfaits.

Statistique Numérique et Analyse des Données

EXERCICES : DÉNOMBREMENT

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Cours de Statistiques inférentielles

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Module 3 : Inversion de matrices

Dénombrement. Chapitre Enoncés des exercices

Initiation à l analyse factorielle des correspondances

Introduction : Mesures et espaces de probabilités

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Comportement d'une suite

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Cours 5 : ESTIMATION PONCTUELLE

Chap. 5 : Les intérêts (Les calculs financiers)

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

DETERMINANTS. a b et a'

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Chapitre 3 : Transistor bipolaire à jonction

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Exercices de mathématiques

55 - EXEMPLES D UTILISATION DU TABLEUR.

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Probabilités et statistique pour le CAPES

Chaînes de Markov. Arthur Charpentier

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Principes et Méthodes Statistiques

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Des résultats d irrationalité pour deux fonctions particulières

Université Pierre et Marie Curie. Biostatistique PACES - UE

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Contribution à la théorie des entiers friables

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Solutions particulières d une équation différentielle...

Formation d un ester à partir d un acide et d un alcool

Simulations interactives de convertisseurs en électronique de puissance

Baccalauréat S Asie 19 juin 2014 Corrigé

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Les algorithmes de tri

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

Régulation analogique industrielle ESTF- G.Thermique

16.1 Convergence simple et convergence uniforme. une suite de fonctions de I dans R ou C.

Gérer les applications

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Télé OPTIK. Plus spectaculaire que jamais.

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Compte Sélect Banque Manuvie Guide du débutant

Résolution numérique des équations aux dérivées partielles (PDE)

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Neolane Leads. Neolane v6.0

Neolane Message Center. Neolane v6.0

Une action! Un message!

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Sommaire Chapitre 1 - L interface de Windows 7 9

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

Mécanique non linéaire

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

Transcription:

INTRODUCTION AUX MATRICES ALÉATOIRES par Djalil Chafaï Résumé. E cocevat les mathématiques comme u graphe, où chaque sommet est u domaie, la théorie des probabilités et l algèbre liéaire figuret parmi les sommets les plus coectés aux autres. Or leur réuio costitue le cœur de la théorie des matrices aléatoires. Cela explique peut-être la richesse exceptioelle de cette théorie très actuelle. Les aspects o liéaires de l algèbre liéaire y jouet u rôle profod et fasciat. Ces otes e présetet quelques aspects.. Itroductio Les sources historiques de la théorie des matrices aléatoires sot multiples. Parmi les plus coues, o trouve les travaux du statisticie Wishart das les aées 920 930 lors de la aissace de la statistique mathématique, les travaux de Goldstie et vo Neuma das les aées 940 950 lors de la aissace de l iformatique et de l aalyse umérique, les travaux de Wiger, Mehta, Gaudi, et Dyso das les aées 950 960 e physique ucléaire, à la joctio etre mécaique quatique et mécaique statistique. Il y a esuite les travaux de Marcheko, Pastur, Girko, Bai, et Silverstei das les aées 960 980, puis ue multitude de travaux plus moderes, balayat u spectre étoammet vaste icluat opérateurs de Schrödiger, physique statistique, systèmes itégrables, systèmes de particules, algèbre d opérateurs et théorie des probabilités libres (Voiculescu), topologie et combiatoire, combiatoire additive et graphes aléatoires, polyômes orthogoaux, équatios différetielles de Pailevé, problèmes

88 DJALIL CHAFAÏ de Riema-Hilbert, aalyse harmoique, théorie des ombres et hypothèse de Riema, aalyse géométrique de grade dimesio, aalyse umérique, classificatio statistique, théorie du sigal et aalyse d images, etc. La motivatio origielle de Wishart était d étudier la matrice de covariace empirique des échatillos gaussies multivariés. Cette matrice de covariace empirique est ue matrice hermitiee aléatoire semi-défiie positive, appelée aujourd hui matrice de Wishart, du même type que celle qui apparaît das le théorème.2 de Marcheko- Pastur. Ces aspects, trop brièvemet abordés das la sectio 3.3, sot redeveus à la mode avec l avèemet de l iformatique et des masses de doées de grade dimesio (big-data). La motivatio origielle de Goldstie et vo Neuma était de compredre le comportemet des algorithmes classiques de l aalyse umérique matricielle, comme ceux de résolutio de systèmes liéaires, lorsque les doées du problème sot etachées d erreurs. Cela coduit tout aturellemet a s itéresser au coditioemet () de matrices aléatoires. Les problèmes qu ils ot formulés à l époque ot été résolus e toute gééralité que das les aées récetes. La motivatio origielle de Wiger était d expliquer la répartitio des iveaux d éergie das les oyaux atomiques. E mécaique quatique, les iveaux d éergie sot liés à des spectres d opérateurs hermities. L idée de Wiger a cosisté à s ispirer de la physique statistique de Boltzma-Gibbs, ce qui coduit à redre ces opérateurs aléatoires, e utilisat par exemple des lois gaussiees. La distributio des écarts etre les valeurs propres des matrices hermitiees aléatoires obteues de la sorte coïcide assez bie avec le phéomèe observé! L approche pioière de Wiger a été reprise et cosidérablemet développée e particulier par Dyso et Mehta. Par ailleurs, à la même époque que Wiger, Philip Warre Aderso a prédit ue trasitio etre localisatio et délocalisatio pour les électros das u semi-coducteur, phéomèe qui se traduit mathématiquemet par ue localisatio/délocalisatio des vecteurs propres d opérateurs de Schrödiger aléatoires. La compréhesio mathématique () Si A M (C), so coditioemet est κ(a) := λ max( AA )/λ mi( AA ) = A 2 2 / A 2 2.

INTRODUCTION AUX MATRICES ALÉATOIRES 89 de ce phéomèe est toujours pas achevée à l heure actuelle. E dimesio, ces opérateurs de Schrödiger aléatoires sot typiquemet des matrices hermitiees à bade, aléatoires. E télécommuicatios, la trasmissio d iformatio etre u groupe d atees émettrices et u groupe d atees réceptrices est modélisable par ue matrices aléatoire. La capacité du caal de commuicatio associée s avère être ue statistique liéaire du spectre de cette matrice, ouvrat la voie à toute ue gamme de questios mathématiques et umériques. Ces quelques exemples historiques illustret la grade diversité des situatios coduisat à des matrices aléatoires. E aglais, o pourra cosulter l ouvrage ecyclopédique [ABF], qui fourit u paorama récet, peut-être plus accessible que les livres [De, HP, M, ER, G, DG, BS, AGZ, F, PS, HJ, T, CD, EK]. E fraçais, o pourra cosulter par exemple les textes de vulgarisatio [Bi, Bi2, P] sur des sujets précis, et même s aveturer das l article de sythèse [G2] qui présete des avacées relativemet récetes sur l u des frots actuels de la recherche. Sigalos efi que plusieurs blogs Iteret proposet des billets de vulgarisatio autour de la théorie des matrices aléatoires, comme le blog de Terece Tao par exemple (e aglais) à l adresse http://terrytao.wordpress.com/. Ces otes costituet u poit de départ, ue ivitatio à la curiosité et à l exploratio. Nous débutos par des expérieces umériques e lagage Scilab dot le code aisi que la sortie graphique sot doés das les figures -2-3. Pour ue matrice M M (C), o ote M := M, et λ (M),..., λ (M) les valeurs propres de M, c est-àdire les racies das C de so polyôme caractéristique. La maière de les uméroter importe peu à ce stade car la plupart des quatités que ous allos cosidérer sot des foctios symétriques des valeurs propres. Pour tout fixé, soit M ue matrice aléatoire dot les coefficiets sot des variables aléatoires sur C (c est-à-dire des vecteurs aléatoires de R 2 ) i.i.d. (2) de moyee m := E(M ij ) = E(RM ij ) + E(IM ij ) (2) Sigifie «idépedats et idetiquemet distribués» ou «idepedet ad idetically distributed».

90 DJALIL CHAFAÏ et de variace σ 2 := E( M ij m 2 ) = E( M ij 2 ) m 2 = Var(RM ij )+Var(IM ij ) > 0. Ce modèle tolère tout à fait que M soit réelle. La matrice M de os expérieces umériques -2-3 a des coefficiets i.i.d. réels de loi de Rademacher ou de de Gauss. Rappelos que la loi de Rademacher (3) de paramètre p [0, ] est la loi sur R doat les poids p et p aux valeurs et. Sa moyee vaut 2p et sa variace 4p( p). La loi de Gauss ou loi ormale sur R de moyee m et de variace σ 2 a pour desité x exp ( 2 ( x m ) ) 2 σ σ 2π. Figure. Les valeurs propres de M sot approximativemet distribuées uiformémet sur le disque uité du pla complexe, et ce phéomèe est d autat plus apparet que est grad. La ormalisatio e assure ue stabilisatio des liges et des coloes. E effet, grâce à la loi des grads ombres, la orme de chaque lige (et de chaque coloe) de M coverge vers σ 2 + m 2 = quad, tadis que leur produit scalaire ted vers m 2 = 0. Cette structure uitaire asymptotique explique pas pourquoi le spectre semble se répartir uiformémet sur le disque uité (elle suggérerait plutôt le cercle uité!) ; Figure 2. Les valeurs propres de l hermitisatio multiplicative MM de M se distribuet approximativemet comme la loi du quart de cercle sur l itervalle [0, 2], et cela est d autat plus apparet que la dimesio est grade ; Figure 3. Les valeurs propres de l hermitisatio additive (4) M+M 2 de M se distribuet approximativemet comme la loi du demi-cercle sur l itervalle [ 2, 2], et cela est d autat plus clair que la dimesio est grade, cf. figure 4. (3) Le terme «Beroulli» est plutôt réservé à la loi du même type sur {0, } plutôt que sur {, }. (4) La ormalisatio par 2 red les coefficiets hors diagoale de variace.

INTRODUCTION AUX MATRICES ALÉATOIRES 9 Figure. Phéomèe d uiversalité de Girko. E oir les valeurs propres de M où M est ue matrice aléatoire carrée à coefficiets i.i.d. de moyee 0 et de variace (de Gauss à gauche et de Rademacher à droite). E bleu le cercle uité du pla complexe. Note : il est égalemet possible d utiliser u histogramme e 3D. fuctio girko ( dim ) // Foctio Scilab. G = grad (dim,dim, or,0,); // matrice de coef. de Gauss stadards B = sig (G); // matrice de coef. de Rademacher +/ - sg = spec (G/ sqrt ( dim )); // spectre et ormalisatio e racie de dim sb = spec (B/ sqrt ( dim )); // idem pour le cas Rademacher clf (); I = [ -:0.0:]; J = sqrt ( -I.^2); subplot (,2,); title ( spritf ( Gauss dim=%i,dim )); set ( gca ()," tight_limits ","o"); set ( gca ()," isoview ","o"); plot (I,J,2); plot (I,-J,2); plot ( real (sg), imag (sg), Marker,., MarkerSize,3, LieStyle, oe ); subplot (,2,2); title ( spritf ( Rademacher dim=%i, dim )); set ( gca ()," tight_limits ","o"); set ( gca ()," isoview ","o"); plot (I,J,2); plot (I,-J,2); plot ( real (sb), imag (sb), Marker,., MarkerSize,3, LieStyle, oe ); edfuctio Ces expérieces umériques permettet de dégager trois phéomèes d uiversalité e grade dimesio, capturés mathématiquemet par les théorèmes.-.2-.3 ci-dessous. Souligos au passage que les hypothèses sot faites ici sur les coefficiets de la matrice, tadis que les résultats coceret les valeurs propres, qui sot des foctios o liéaires et o explicites des coefficiets de la matrice.

92 DJALIL CHAFAÏ Figure 2. Phéomèe d uiversalité de Marcheko-Pastur. E oir, l histogramme des valeurs propres de MM où M est ue matrice aléatoire carrée à coefficiets i.i.d. de moyee 0 et de variace (de Gauss à gauche et de Rademacher à droite). E bleu, la desité de la loi du quart de cercle sur l itervalle [0, 2]. Note : la matrice MM est hermitiee semi-defiie positive : so spectre est das R +. fuctio marpas ( dim ) // Foctio Scilab. G = grad (dim,dim, or,0,); // matrice de coef. de Gauss stadards B = sig (G); // matrices de coef. de Rademacher +/ - sg = sqrt ( spec (G*G )/ dim ); // symetrisatio, ormalisatio, spectre sb = sqrt ( spec (B*B )/ dim ); // idem pour la versio Rademacher clf (); I = [0:0.0:2]; J = sqrt (4 -I.^2)/ %pi ; subplot (,2,); title ( spritf ( Gauss dim=%i,dim )); set ( gca ()," tight_limits ","o"); plot2d (I,J,2); histplot ( fix ( sqrt ( dim )), sg ); subplot (,2,2); title ( spritf ( Rademacher dim=%i, dim )); set ( gca ()," tight_limits ","o"); plot2d (I,J,2); histplot ( fix ( sqrt ( dim )), sb ); edfuctio Afi de décrire mathématiquemet la répartitio des valeurs propres, o itroduit la distributio spectrale empirique d ue matrice A M (C), µ A := δ λk (A). k= Il s agit tout simplemet d ue loi de probabilité discrète, plus précisémet d ue mesure de comptage ormalisée. Pour tout esemble E C, la quatité µ A (E) = card{ k : λ k(a) E}

INTRODUCTION AUX MATRICES ALÉATOIRES 93 Figure 3. Phéomèe d uiversalité de Wiger. E oir l histogramme des valeurs propres de M+M 2 où M est ue matrice aléatoire carrée à coefficiets i.i.d. de moyee 0 et de variace (de Gauss à gauche et de Rademacher à droite). E bleu la desité de la loi du demi-cercle sur l itervalle [ 2, 2]. Note : la matrice M+M 2 est hermitiee, et so spectre est doc réel. fuctio wiger ( dim ) // Foctio Scilab. G = grad (dim,dim, or,0,); // matrice de coef. de Gauss stadards B = sig (G); // matrices de coef. de Rademacher +/ - sg = spec ((G+G )/ sqrt (2))/ sqrt ( dim ); // symetrisatio, ormalisatio, spectre sb = spec (( B+B )/ sqrt (2))/ sqrt ( dim ); // idem pour la versio Rademacher clf (); I = [ -2:0.0:2]; J = sqrt (4 -I.^2)/(2* %pi ); subplot (,2,); title ( spritf ( Gauss dim=%i,dim )); set ( gca ()," tight_limits ","o"); plot2d (I,J,2); histplot ( fix ( sqrt ( dim )), sg ); subplot (,2,2); title ( spritf ( Rademacher dim=%i, dim )); set ( gca ()," tight_limits ","o"); plot2d (I,J,2); histplot ( fix ( sqrt ( dim )), sb ); edfuctio Figure 4. Graphiques illustrat l effet de la dimesio sur la distributio du spectre des matrices de Wiger (figure 3 et théorème.3), pour les dimesios 30, 20, 600. Ces graphiques correspodet à ue seule matrice à chaque fois. Si o répète l expériece, le graphique e petite dimesio (à gauche) va beaucoup fluctuer, tadis que celui e grade dimesio (à droite) va très peu fluctuer. U caractère aléatoire s efface e grade dimesio et laisse place à u détermiisme : la loi du demi-cercle.

94 DJALIL CHAFAÏ est la proportio de valeurs propres de A qui sot das E. Pour toute foctio f o a f dµ A = E(f(X)) = f(λ k (A)) où X est ue variable aléatoire discrète de loi µ A. O retrouve µ(e) lorsque f = E. Si A est aléatoire alors µ A est ue loi de probabilité discrète aléatoire (il y a deux aléas!), et das ce cas, µ A (E) et f dµ A sot des variables aléatoires. Rappelos qu o dit qu ue propriété aléatoire a lieu presque sûremet lorsqu elle a lieu sur u évéemet de probabilité. Rappelos que pour tout fixé, M est ue matrice aléatoire dot les coefficiets (M ij ) i,j sot i.i.d. de moyee m et de variace σ 2. k= Théorème. (Uiversalité de Girko et loi du cercle) Presque sûremet, pour tout pavé ou boule E de R 2, o a lim µ M (E) = µ(e) où µ est la loi uiforme sur le disque de R 2 de rayo σ («loi du cercle») de desité (x, y) πσ 2 (x, y). {(x,y) R 2 : x 2 +y 2 σ} Théorème.2 (Uiversalité de Marcheko-Pastur et loi du quart de cercle) E otat H := MM, o a que presque sûremet, pour tout itervalle I de R +, lim µ H (I) = µ(i) où µ est la loi du quart de cercle sur [0, 2σ] et de desité 4σ x 2 x 2 πσ 2 [0,2σ] (x). Théorème.3 (Uiversalité de Wiger et loi du demi-cercle) E otat H := M+M 2, o a que presque sûremet, pour tout itervalle I de R, lim µ H (I) = µ(i)

INTRODUCTION AUX MATRICES ALÉATOIRES 95 où µ est la loi du demi-cercle sur [ 2σ, 2σ] et de desité x 4σ 2 x 2 2πσ 2 [ 2σ,2σ] (x). Das chacu de ces trois théorèmes, presque sûremet, ue moyee empirique aléatoire coverge vers ue limite détermiiste. Cela fait peser à la loi forte des grads ombres (5), qui e s applique pas ici car les valeurs propres e sot pas idépedates. D u autre côté, la limite est décrite par ue loi de probabilité uiverselle qui e déped de la loi des coefficiets de la matrice de départ qu à travers leur variace. Cela fait peser au théorème cetral limite (6) et sa loi ormale uiverselle. Si ue variable aléatoire de C (vecteur aléatoire de R 2 ) suit la loi uiforme sur le disque uité, de desité z π {z C: z }, alors la partie réelle et la partie imagiaire suivet toutes les deux la loi du demi-cercle de desité t 2π t 2 [,] (t). Elles e sot pas idépedates. Le rayo suit la loi de desité r r [0,] (r) (ce est i la loi uiforme i la loi du quart de cercle) tadis que la phase suit la loi uiforme sur [0, 2π]. La valeur absolue de la partie réelle et la valeur absolue de la partie imagiaire suivet la loi du quart de cercle sur [0, ], de desité t 4π t 2 [0,] (t). Malgré ces relatios, il y a pas de liaiso directe etre le spectre de M du théorème. et le spectre de H des théorèmes.2 et.3. O observe même u facteur 2 etre le rayo du disque du théorème. et le rayo des itervalles des théorèmes.2 et.3. Cela suggère qu asymptotiquemet, la orme d opérateur max k λ k ( MM ) de M est deux fois plus grade que le rayo spectral max k λ k (M) de M, ce qui peut être prouvé rigoureusemet lorsque E(M ij ) = 0 et E( M ij 4 ) <. C est le sige de l aormalité de M, cf. sectio 3.4. (5) Si (X ) sot des v.a.r. i.i.d. de moyee m alors p.s. X := X + +X m quad. Si (X ) sot des v.a.r. i.i.d. de moyee m et de variace σ 2 alors P( X m σ I) µ(i) quad, pour tout itervalle I R, où µ est la loi gaussiee de moyee 0 et de variace.

96 DJALIL CHAFAÏ 2. Esquisses de preuves du théorème de Wiger Le théorème.3 a été dégagé par Eugee Wiger das les aées 950. La versio cosidérée ici est due à Leoid Pastur et date des aées 970. Nous esquissos ci-dessous ue preuve du théorème.3 par la méthode des momets, puis par la méthode de la résolvate. Nous esquissos égalemet deux preuves pour le cas gaussie du GUE (7), basées sur ue miimisatio d éergie, et sur des polyômes orthogoaux. La matrice aléatoire H est hermitiee, et les variables aléatoires {H ij } i j sot idépedates de moyee 2 Rm. De plus {H ij } i<j sot de même loi sur C de variace σ 2, tadis que {H ii } i sot de même loi sur R de variace 2Var(RM ). Nous pouvos dès à préset préciser le pourquoi de la ormalisatio e / : le momet d ordre 2 de µ H se stabilise grâce à la loi forte des grads ombres : x 2 dµ H (x) = λ k (H) 2 = 2 Tr(H2 ) k= = 2 i= j= H ij 2 p.s. σ2 + m 2. Le comportemet du premier momet est aussi facile à étudier : x dµ H (x) = λ k (H) = Tr(H) 3/2 k= = H + + H 3/2 p.s. 0. Les deux premiers momets de la loi du demi-cercle µ sur [ 2σ, 2σ] valet 0 et σ 2. Aisi, le premier momet de µ H coverge vers le premier momet de µ, tadis que le secod momet de µ H e coverge vers celui de µ que si m = 0. Cela est dû au comportemet explosif de la plus grade valeur propre de H lorsque m 0. Il y a pas de cotradictio : la covergece e loi de µ H empêche pas ue fractio asymptotiquemet égligeable de valeurs propres d exploser quad. (7) Voir 2.3 pour la sigificatio de GUE.

INTRODUCTION AUX MATRICES ALÉATOIRES 97 Modèle réduit. Pour établir le théorème.3, ue première étape préparatoire, omise ici (8), cosiste à réduire le problème à l éocé suivat : soit H ue matrice hermitiee aléatoire telle que {H ij } i j sot idépedates de moyee 0 et de variace, borées et à valeurs das {z C : z C}, C > 0, avec {H ii } i i.i.d. sur R et {H ij } i<j i.i.d. sur C. Soit µ la loi du demi-cercle sur l itervalle [ 2, 2], de desité x 4 x 2 2π [ 2,2] (x). Alors Eµ := Eµ H coverge e loi quad vers µ, i.e. lim E f dµ = f dµ, pour toute foctio f das ue classe de foctios suffisammet riche pour garatir la covergece e loi. Nous avos à préset deux méthodes classiques pour achever la preuve du théorème.3 : la méthode des momets, de ature combiatoire, basée sur la classe de foctios {x x r : r N}, et la méthode de la trace de la résolvate, de ature aalytique, basée sur la classe de foctios {x (x z) : z C, Iz > 0}. 2.. Méthode des momets (combiatoire). O se propose d établir la covergece des momets pour le modèle réduit : r N, lim E x r dµ (x) x r dµ. Les momets impairs de µ sot uls tadis que les pairs sot les ombres de Catala : r N, 2 4 x x r dµ(x) = x r 2 0 2π 0 si r = 2k +, dx = ) si r = 2k. k+( 2k k (8) Cette étape fait appel à divers outils : formules variatioelles mi-max de Courat-Fischer, iégalité de Hoffma-Wieladt, iégalité de cocetratio de Azuma-Hoeffdig, lemme de Borel-Catelli, loi forte des grads ombres, foctios caractéristiques, etc. Certais sot abordés das l appedice A.

98 DJALIL CHAFAÏ Nous pouvos exprimer les momets de Eµ e foctio des momets joits des coefficiets de H grâce à la formule suivate : E x r dµ (x) = +r/2 E λ k (H) r = +r/2 ETr(Hr ) = +r/2 k= i,...,i r E(H i,i 2 H ir,i r+ ) où i r+ := i. Pour r = o obtiet bie E x dµ (x) = E H ii = m = 0 et pour r = 2, E x 2 dµ (x) = 2 E i= j= i= H ij 2 = σ 2 + m 2 = = + L étude du cas r = 3 est u peu plus subtile. O a E x 3 dµ (x) = +3/2 E(H ij H jk H ki ). i,j,k ( ) 2. Si deux élémets parmi {{i, j}, {j, k}, {k, i}} sot disticts alors E(H ij H jk H ki ) = 0 par idépedace et cetrage. Das le cas cotraire, o a i = k ou i = j ou k = j. Si i = k alors E(H ij H jk H ki ) = E( H ii 2 H ij ) qui est ul si j i et qui a pas de cotributio asymptotique si j = i car o a = o( +3/2 ) triplets vérifiat i = j = k. Si i = j alors E(H ij H jk H ki ) = E(H ii H ik 2 ) et le raisoemet est idetique. Si k = j alors E(H ij H jk H ki ) = E( H ij 2 H jj ) et le raisoemet est à ouveau idetique. Aisi, le momet d ordre 3 de Eµ teds vers 0 quad. Lorsque r est quelcoque et fixé, o associe à chaque r-uplet d idices i,..., i r u graphe orieté, obteu e positioat leurs valeurs sur ue demi-droite horizotale figurat N, cf. figure 5. Les sommets du graphe sot les valeurs distictes prises par ces idices, et o ote t leur ombre. Les arêtes du graphe sot les liaisos (i k, i k+ ) avec k r + et i r+ := i. O dit qu il s agit d u graphe G(t). Deux graphes G(t) sot équivalets lorsque qu o peut passer de l u à l autre e permutat les idices. Des graphes G(t) équivalets

INTRODUCTION AUX MATRICES ALÉATOIRES 99 2 3 4 N Figure 5. Graphe pour r = 4, i = i 3 =, i 2 = 4, i 4 = 3, correspodat à E(H 4H 4H 3H 3). Les arêtes sot 4, 4, 3, 3. O a t = 3. doet la même valeur à E(H i,i 2 H ir,i r+ ), otée E(H G ). Il y a ( ) ( t + ) graphes G(t) das chaque classe d équivalece. Par ailleurs, das chaque classe d équivalece, o peut supposer que les sommets sot,..., t r, et aisi le ombre total de classes d équivalece c r e déped que de r. Afi de calculer les cotributios, o distigue trois types de classes de graphes G(t) : type : ceux pour qui chaque arête est présete das l autre ses le même ombre de fois, et le graphe squelette obteu e effaçat les orietatios des arêtes est u graphe sas cycles, c est-à-dire u arbre. Exemple : le cas de la figure 5, qui doe l arbre à trois sommets dot les arêtes sot 3 et 4 ; type 2 : ceux pour qui ue arête au mois apparaît qu ue seule fois. Exemple : E(H 2 H 23 H 3 ) e cotiet qu ue seule fois les arêtes 2, 2 3, 3 ; type 3 : ceux qui e sot pas de type ou de type 2. C est le cas par exemple pour E(H 2 H 23 H 3 H 2 H 23 H 3 ), qui est i de type i de type 2 car les arêtes 2, 2 3, 3 apparaisset chacue deux fois das le même ses, ou ecore pour E(H 2 H 2 H 3 H 32 H 23 H 3 ), qui est i de type i de type 2 car les arêtes 2, 2 3, 3 apparaisset chacue das les deux ses mais le graphe obteu e effaçat les orietatios des arêtes est le cycle 2 3. Nous disposos des faits suivats :

00 DJALIL CHAFAÏ Les graphes de type 2 ot ue cotributio ulle. E effet, si G est u graphe de type 2 alors E(H G ) = 0 par idépedace et cetrage ; Les graphes de type 3 ot ue cotributio asymptotiquemet ulle. E effet, si G est u graphe G(t) de type 3 alors o peut établir sas grade difficulté que t (r + )/2, qui doe ( ) ( t + ) t /2+r/2. D autre part, le ombre de classes de type 3 est majoré par le ombre total de classes c r = O(). À préset, comme les coefficiets de H sot borés, o a E(H G ) = O(), et doc classes t.3 ( ) ( t + ) +r/2 E(H G ) = O( /2 ) = o (); Seuls les graphes de type cotribuet asymptotiquemet. E effet, pour tout graphe G de type o a E(H G ) = par idépedace car les coefficiets de H ot ue variace de. Cela ramèe le problème à la détermiatio du ombre de classes de type. Il y a pas de graphes de type si r est impair. Si r est pair, disos r = 2k, alors t = r/2, et les classes de type sot e bijectio avec les parethésages : il y e a doc 2k ) k+( k (ombres de Catala), d où efi cl. t. ( ) ( t + ) +r/2 E(H G ) = k + k + ( ) 2k k + k ( ) 2k. k Ceci achève otre esquisse de preuve du théorème.3 par la méthode des momets. E plus des parethésages, les ombres de Catala permettet de déombrer des suites d objets variées comme les excursios de la marche aléatoire simple, les partitios o croisées, les chemis de Dyck, etc, qui sot doc toutes e bijectio. Sigalos par ailleurs que lorsque M est gaussiee, il est possible d exprimer les momets avec la matrice de covariace e utilisat ue formule de Wick, qui est ue coséquece de l itégratio par parties, cf. [G]. 2.2. Méthode de la résolvate (aalyse). Nous veos de voir que la famille de foctios test {x x r : r N} ramèe le problème à la combiatoire des momets. Soit C + := {z C : Iz > 0}. Il

INTRODUCTION AUX MATRICES ALÉATOIRES 0 se trouve que la famille de foctios test {x /(x z) : z C + } ramèe le problème à ue équatio pour la trace de la résolvate, liée à la trasformée de Cauchy-Stieltjes. La trasformée de Cauchy-Stieltjes S ν : C + C d ue loi ν sur R est défiie par S ν (z) := x z dν(x). O a toujours S ν (z) /Iz et IS ν (z) 0. La foctio S ν caractérise ν. Elle est aalytique sur C +. De plus, ue suite (ν ) de lois sur R coverge e loi vers ue loi ν sur R si et seulemet si (S ν ) coverge poctuellemet vers S ν sur C +. Si ν = k= δ λk (A) est la distributio spectrale empirique d ue matrice hermitiee A, et si G A (z) := (A zi) est la résolvate de A e z C +, alors S ν (z) = λ k (A) z = λ k (A zi) = Tr(G A(z)). k= Si A est aléatoire, o a E(S ν (z)) = S Eν (z) grâce au théorème de Fubii-Toelli. Pour établir le théorème.3, o observe tout d abord que si µ est la loi du demi-cercle de desité x 4 x 2 2π [ 2,2] (x) alors u calcul par la méthode des résidus doe k= S µ (z) = z + z 2 4, 2 e fait l uique solutio à partie imagiaire positive de l équatio du secod degré s 2 + sz + = 0 e s, qui s écrit égalemet, sous forme de poit fixe, s + z + s = 0. Soit µ la mesure spectrale empirique de H. L idée est d établir que S Eµ est solutio approchée de cette équatio. La formule d iversio par blocs de Schur affirme que pour toute partitio {,..., } = K K c, (A ) K,K = (A K,K A K,K c(a K c,k c) A K c,k). E utilisat cette formule pour la résolvate de H, avec K = {k} où k varie de à, o obtiet, après de logs calculs, ε := S Eµ (z) + 0. z + S Eµ (z)

02 DJALIL CHAFAÏ Cela coduit au résultat. Les détails, omis ici, et qu o peut trouver par exemple das [BS] ou [AGZ], e sot pas plus simples que pour la méthode des momets. Sigalos par ailleurs que lorsque M est gaussiee, il est possible d utiliser l idetité de la résolvate G B G A = G A (A B)G B et ue itégratio par parties plutôt que la formule d iversio par blocs, et cette stratégie s éted même au delà du cas gaussie par ue techique d iterpolatio, cf. [PS]. 2.3. Méthode de miimisatio d éergie pour GUE. O cosidère das cette sectio le cas gaussie où {RM ij, IM ij } i,j sot i.i.d. de loi gaussiee de moyee 0 et de variace /2. Das ce cas, la loi de la matrice hermitiee aléatoire H = (M + M )/ 2 du théorème.3 vérifie : {H ii, RH ij, IH ij } i j idépedates et de loi gaussiee cetrée ; {H ii } i de variace ; {RH ij, IH ij } i<j de variace /2, et doc {H ij } i<j de variace. Idetifios l esemble des matrices hermitiees H := {H M (C) : H = H} à C (2 )/2 R R 2. La loi de H admet ue desité proportioelle à H e 2 i,j= H ij 2 = e 2 Tr(HH ) = e 2 Tr(H2). La loi de H est ivariate par cojugaiso uitaire : UHU et H ot même loi pour toute matrice uitaire U. O dit que H appartiet à l esemble gaussie uitaire, e aglais «Gaussia Uitary Esemble» (GUE). Le chagemet de variables H (U, D) issu de la diagoalisatio H = U DU e base orthoormée permet d établir, par itégratio de la variable U, que les valeurs propres λ ( H),..., λ ( H) de H admettet ue desité proportioelle à ( ) λ R e 2 i= λ2 i λ i λ j 2. i<j Le détermiat de Vadermode ci-dessus exprime ue dépedace, et proviet du jacobie du chagemet de variables. La desité s écrit

INTRODUCTION AUX MATRICES ALÉATOIRES 03 égalemet e E(λ) où E (λ) := λ 2 i + 2 l 2 λ i= i<j i λ j. Cela permet de cocevoir λ ( H),..., λ ( H) comme des particules chargées das le pla, cofiées sur la droite réelle, dot l éergie de cofiguratio est E (λ). La structure de E idique que ces particules subisset à la fois u champ extérieur quadratique qui les cofie près de l origie, aisi qu ue force coulombiee qui les fait se repousser mutuellemet. De ces cotraites atagoistes aît u équilibre macroscopique quad. Réécrivos l éergie E (λ) au moye de la mesure de comptage des valeurs propres otée µ := µ H : ( x E (λ) = 2 2 ) 2 dµ (x) + l x y x y dµ (x)dµ (y). Cela suggère que quad, la mesure empirique µ coverge vers l esemble des miima de la foctioelle quadratique strictemet covexe E défiie pour toute loi ν sur R par x 2 E(ν) := 2 dν(x) + l x y dν(x)dν(y). Or o peut établir précisémet que ν E(ν) est miimisée par ue uique loi de probabilité : la loi du demi-cercle µ de desité 4 x 2 x 2π [ 2,2] (x). Cela permet d établir le théorème.3 das le cas gaussie du GUE. Cette méthode, détaillée das [AGZ], est u exemple spécial de pricipe de grades déviatios. Elle reste valable au delà du GUE, pour des modèles de matrices aléatoires uitairemet ivariats de desité proportioelle à e Tr(V (H)), où par défiitio Tr(V (H)) := k= V (λ k (H)). La loi obteue à la limite déped de V et est pas la loi du demi-cercle e gééral, ce qui motre qu il y a pas uiversalité. 2.4. Méthode des polyômes orthogoaux pour GUE. Soit (P k ) k 0 la suite des polyômes de Hermite, orthogoaux et ormalisés pour la loi gaussiee stadard sur R de desité γ(x) =

04 DJALIL CHAFAÏ (2π) /2 e x2 /2. Pour tous k, k N, P k (x)p k (x) γ(x) dx = k=k. Les polyômes (P k ) k 0 vérifiet la récurrece à trois termes xp k = k + P k+ + kp k. Réécrivos la desité ( ) du GUE e utilisat ces polyômes. Le détermiat de Vadermode i<j λ i λ j est proportioel à dét((p i (λ j )) i,j ) (cela découle uiquemet du fait que P k est u polyôme de degré k pour tout k). E posat K(x, y) := P k (x)p k (y), k=0 o obtiet que ( i<j λ i λ j 2 ) 2 = i<j λ i λ j est proportioel à dét((k(λ i, λ j )) i,j ). Cela fourit ue représetatio détermiatale de la desité ( ) du GUE, basée sur le oyau K, poit de départ d ue aalyse fie. Cette approche, due à Gaudi et Mehta, permet d établir e particulier que si H est GUE alors la desité de Eµ H s écrit La desité de µ := Eµ H x γ(x) k=0 s écrit doc P 2 k (x). x P 2 k ( x)γ( x). k=0 À partir de cette formule, ue première méthode, exploitat les propriétés d orthogoalité de la suite (P k ) k 0, permet d obteir ue formule de récurrece à trois termes pour les momets de µ, qui fait écho à la formule de récurrece à trois termes pour les polyômes orthogoaux (P k ) k 0. Cela permet d établir fialemet que µ coverge vers la loi du demi-cercle par ue méthode de momets. Alterativemet, par des calculs utilisat l itégratio par parties et l orthogoalité de (P k ) k 0, o peut établir que la trasformée de Laplace au poit θ de la loi de desité x P 2 ( x)γ( x) est solutio quad de l équatio différetielle 4θf + 2f θf = 0,

INTRODUCTION AUX MATRICES ALÉATOIRES 05 qui est précisémet l équatio différetielle satisfaite par la trasformée de Laplace d ue loi de l arcsius sur [ 2, 2]. Cette observatio permet d établir que la loi de desité x P 2 ( x)γ( x) coverge e loi quad vers la loi de l arcsius sur [ 2, 2] de desité x π (4 x 2 ) /2 [ 2,2] (x). E exploitat le fait que la desité de µ est ue moyee de Cesàro, o peut e déduire que µ coverge e loi vers la loi de U ξ où U et ξ sot des variables aléatoires idépedates de loi uiforme sur [0, ] et de loi de l arcsius sur [ 2, 2] respectivemet. Il s agit là d ue représetatio particulière de la loi du demi-cercle sur [ 2, 2]! Les détails aisi que de ombreuses référeces se trouvet das [L]. 3. Au delà du théorème de Wiger L étude des matrices aléatoires e se résume pas à l étude du spectre. Le comportemet des vecteurs propres est par exemple d ue grade importace pour la compréhesio des modèles de graphes aléatoires, mais aussi des opérateurs de Schrödiger aléatoires e physique e liaiso avec le phéomèe de localisatio d Aderso. D autre part, les propriétés o asymptotiques des modèles de matrices aléatoires jouet u rôle importat das les applicatios, comme par exemple pour les problèmes de complétio, d échatilloage, de classificatio, etc. O distigue deux grades familles de modèles de matrices aléatoires. La première famille est costituée par les modèles das lesquels les coefficiets de la matrice sot i.i.d. comme das les théorèmes.,.2,.3. Das ce cas, la loi du spectre et des vecteurs propres est e gééral pas coue. La secode famille est costituée par les modèles dot la loi est uitairemet ivariate. Das ce cas, les vecteurs propres sot idépedats des valeurs propres, la matrice des vecteurs propres suit la loi uiforme sur le groupe uitaire, et la loi des valeurs propres est coue (elle fait souvet iterveir u détermiat de Vadermode lié au jacobie du chagemet de variable comme das l exemple du GUE). Le modèle gaussie GUE appartiet aux deux familles : les coefficiets de la matrice sot i.i.d. et la loi est uitairemet ivariate. Le caractère explicite de la loi des valeurs propres des modèles uitairemet ivariats comme le GUE permet

06 DJALIL CHAFAÏ d effectuer des calculs précis, ce qui coduit à dégager des comportemets quatitatifs ou asymptotiques, dot certais sot uiversels, e ce ses qu il restet valables au delà du modèle cosidéré. Nous revoyos à [ER] pour u paorama riche et éclairat, e liaiso avec les oyaux de Bessel, de Airy, et le oyau sius, aisi qu avec les décompositios matricielles classiques. 3.. Comportemet au bord et uiversalité locale. Le théorème.3 de Wiger cocere ue uiversalité au iveau global (esemble du spectre) et au premier ordre. Le comportemet global au secod ordre cosiste par exemple à étudier le comportemet asymptotique quad de f dµ H f dµ. O peut établir qu e ormalisat par u coefficiet qui déped de et de f, o obtiet ue covergece e loi vers ue loi gaussiee. O dit qu il s agit d u théorème cetral limite pour les statistiques liéaires du spectre. Lorsque f est assez régulière, la ormalisatio e déped pas de, tadis que lorsque f est ue idicatrice d itervalle, la ormalisatio peut être très différete de. Ces comportemets ihabituels sot dûs à la dépedace (répulsio) etre les valeurs propres. Notos par ailleurs que pour f(x) = x r avec r N, ous retrouvos les momets, qui coverget à vitesse pour le modèle réduit. Nous revoyos à [Da] pour tous ces aspects. La covergece globale fourie par le théorème.3 de Wiger empêche pas ue fractio asymptotiquemet égligeable du spectre de diverger vers l ifii. Si par exemple m 0 alors o peut établir qu ue valeur propre va diverger vers l ifii à vitesse. Ceci mèe à l étude du comportemet du bord du spectre. Au premier ordre, o motre que si m = 0 et si le momet d ordre 4 de H 2 est fii alors les valeurs propres extrêmes coverget vers le bord du support de la loi limite : et λ mi := mi k λ k( λ max := max k λ k( H) p.s. 2σ H) p.s. 2σ.