Principe de symétrisation pour la construction d un test adaptatif



Documents pareils
Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

IFT3245. Simulation et modèles

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

FIMA, 7 juillet 2005

Suites numériques 3. 1 Convergence et limite d une suite

NON-LINEARITE ET RESEAUX NEURONAUX

Programmes des classes préparatoires aux Grandes Ecoles

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Texte Agrégation limitée par diffusion interne

ÉTUDE ASYMPTOTIQUE D UNE MARCHE ALÉATOIRE CENTRIFUGE

Probabilités III Introduction à l évaluation d options

3. Conditionnement P (B)

1 Définition et premières propriétés des congruences

Espérance conditionnelle

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Image d un intervalle par une fonction continue

Fonctions de plusieurs variables

Chapitre 2 Le problème de l unicité des solutions

Tests exacts d indépendance sérielle dans les cas de distributions continues et discrètes

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Évaluation de la régression bornée

Modélisation géostatistique des débits le long des cours d eau.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

I. Polynômes de Tchebychev

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Optimisation Discrète

Économetrie non paramétrique I. Estimation d une densité

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Moments des variables aléatoires réelles

Introduction à la Statistique Inférentielle

3. Caractéristiques et fonctions d une v.a.

Théorèmes de Point Fixe et Applications 1

PROBABILITES ET STATISTIQUE I&II

Introduction à l étude des Corps Finis

La classification automatique de données quantitatives

La fonction exponentielle

Source Coding in Sensor Networks

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Condition de stabilité d'un réseau de les d'attente à deux stations et N classes de clients 1

Les indices à surplus constant

Echantillonnage Non uniforme

Propriétés des options sur actions

I. Ensemble de définition d'une fonction

Programmation linéaire et Optimisation. Didier Smets

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Introduction à la statistique non paramétrique

Exercices Corrigés Premières notions sur les espaces vectoriels

3 Approximation de solutions d équations

Dualité dans les espaces de Lebesgue et mesures de Radon finies

PRIME D UNE OPTION D ACHAT OU DE VENTE

Approximations variationelles des EDP Notes du Cours de M2

4. Martingales à temps discret

Programmation linéaire

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Continuité d une fonction de plusieurs variables

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Intégration et probabilités TD1 Espaces mesurés Corrigé

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

Chapitre VI - Méthodes de factorisation

MCMC et approximations en champ moyen pour les modèles de Markov

Rapport de projet Risque de Crédit, Risque de Défaut : Étude de l influence du taux de recouvrement sur le prix de CDOs.

Relation d ordre. Manipulation des relations d ordre. Lycée Pierre de Fermat 2012/2013 Feuille d exercices

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Le modèle de régression linéaire

Précision d un résultat et calculs d incertitudes

1 Complément sur la projection du nuage des individus

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Modèles et Méthodes de Réservation

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

La mesure de Lebesgue sur la droite réelle

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Coup de Projecteur sur les Réseaux de Neurones

TESTS D'HYPOTHESES Etude d'un exemple

Compléments de documentation Scilab : affichage de texte et formatage de nombres

Travaux dirigés d introduction aux Probabilités

Cours de Tests paramétriques

Scénarios économiques en assurance

statique J. Bertrand To cite this version: HAL Id: jpa

Sur certaines séries entières particulières

Objets Combinatoires élementaires

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Cours 02 : Problème général de la programmation linéaire

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Mesure et gestion des risques d assurance

Simulation de variables aléatoires

Équations non linéaires

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Transcription:

Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université Paris Descartes, MAP5 - UMR CNRS 8145 et INRIA Saclay Ile-de-France équipe Select, France, yves.rozenholc@parisdescartes.fr Résumé. Ayant observé un vecteur aléatoire y de R n, et notant f son espérance, nous bâtissons un test non-asymptotique de l hypothèse nulle que f = 0 contre l alternative f 0, sous la seule hypothèse que les composantes y i de y sont indépendantes entre elles et de loi symétrique autour de leur espérance. Nous ne supposons pas les composantes y i f i de même loi. Sans hypothèse supplémentaire, la loi d une statistique de test est inconnue même sous l hypothèse nulle. Nous proposons donc une calibration fondée sur un principe de symétrisation exploitant l hypothèse de symétrie. Le test est non-asymptotique. Sa puissance est décrite dans le cadre du modèle de régression, où f i = F x i ) pour une fonction F inconnue et des x i [0, 1] déterministes : le test est adaptatif sur des classes de régularité Hölderienne sous des hypothèses générales de moments. Cette présentation est effectuée pour la session spéciale du groupe statistique mathématique sur les techniques de symétrisation. Mots-clés. test adaptif, test minimax, alternative nonparamétrique, symétrisation, hetéroscedasticité. Abstract. We observe a random vector y in R n. With f = Ey), we build a nonasymptotic test for the null hypothesis f = 0 against the alternative hypothesis that f 0 when the components y i of y are independent with a distribution that is symmetrical about its expectation. The components y i f i are not assumed to be identically distributed. The distribution of a given test statistic is unknown even under the null hypothesis due to the lack of assumptions on the distribution of y. Hence, we propose a calibration that is based on a symmetrization principle that exploits the symmetry assumption. The test is non-asymptotic. Its power is described in the regression setting, where f i = F x i ) for an unknown regression function F and fixed design points x i [0, 1]. The test is adaptive with respect to Hölderian smoothness in the regression setting under mild assumptions on ε. This presentation is for the special session on symmetrization principles. Keywords. adaptive test, minimax hypothesis testing, nonparametric alternatives, symmetrization, heteroscedasticity. 1

1 Construction du test Nous observons un vecteur aléatoire y R n et notons y = f + ε, où f est l espérance inconnue de y et ε = ε 1,..., ε n ) T est un vecteur aléatoire centré non observé. Nous supposons que les ε i, i = 1,..., n, sont mutuellement indépendantes et de loi symétrique, c est-à-dire que ε i a la même loi que ε i. En revanche, nous ne supposons pas que les ε i sont de même loi. Notre objectif est de bâtir un test non-asymptotique de H 0 : f = 0 contre H 1 : f 0 sans autre hypothèse sur f ou ε. Nous proposons un multi-test dont la calibration repose sur un principe de symétrisation. 1.1 Région de rejet Construisons tout d abord une forme de région de rejet. Pour ce faire, nous considérons une collection M de partitions m de 1,..., n} en D m parties non vides. Pour tout m M, nous notons Π m le projecteur orthogonal de R n sur l espace vectoriel constitué des vecteurs u dont les composantes sont constantes par morceaux sur chacune des D m parties pour tout e m et tous i, j e, u i = u j ). Notons que la dimension de cet espace est D m et que pour tout u dans cet espace, Π m u 2 n = ) 2 1 u k e e m k e où. n désigne la norme euclidienne dans R n et e désigne le cardinal de e. La construction de la région de rejet repose sur le fait que sous H 0, Π m y 2 n = Π m ε 2 n a tendance à être petit pour tout m tandis que sous H 1, nous pouvons typiquement trouver au moins) une partie e 1,..., n} telle que k e y k) 2 ait tendance à être grande, de sorte que Π m y 2 n ait elle aussi tendance à être grande si e m. Le test consiste alors à rejeter H 0 s il existe au moins une partition m dans la collection M telle que Π m y 2 n soit trop grande. Cela signifie que pour chaque m M, nous réalisons un test de niveau α m consistant à rejeter H 0 si Π m y 2 n exède un certain seuil q y mα m ), choisi de telle sorte que P H0 Πm y 2 n > q y mα m ) ) α m. 1) Ici, nous utilisons la notation qmα y m ) pour insister sur le fait que nous choisirons, au bout du compte, un seuil dépendant de y. Nous rejetons H 0 si l un au moins de ces tests conduit à rejeter H 0. Notre région de rejet est donc sup Πm y 2 n q y mα m ) } > 0. 2) Il est clair que si les α m sont choisis tel que α = α m, alors notre test est de niveau α. Par exemple, α m = α/ M convient. 2

1.2 calibration Il reste à déterminer q y mα m ) vérifiant 1) lorsque m et α m sont donnés. Si cela était possible, on définirait q y mα m ) comme étant le quantile d ordre 1 α m de la loi de Π m y 2 n sous H 0, c est-à-dire la loi de Π m ε 2 n. Cela est malheureusement impossible sans hypothèses supplémentaires sur la loi de ε. Nous proposons alors de considérer des seuils q y mα m ) aléatoires fondés sur un principe de symétrisation. Précisément, nous définissons q y mα m ) = inf x R, P [ Π m w y) 2 n > x y ] α m }, 3) où w est un vecteur aléatoire de R n indépendant de y dont les composantes sont i.i.d. et telles que P w i = 1) = P w i = 1) = 1/2, et w y désigne le vecteur de R n de composantes w i y i. Ainsi, nous symétrisons y en en multipliant chaque composante par un signe aléatoire. Cela n affecte pas la loi sous H 0 puisque la loi de y est symétrique sous H 0. Grâce à cela, la contrainte de niveau 1) est bien satisfaite. En revanche, sous H 1, la symétrisation transforme la loi non symétrique de y en une loi symétrique, imitant le comportement sous l hypothèse nulle et laissant envisager une bonne puissance. Nous conditionnons par y pour que les seuils q y mα m ) ne dépendent pas de la loi inconnue de y, mais dépendent uniquement de y qui est bien observé) et de la loi connue de w. 1.3 Implémentation Plutôt que de faire un calcul exact des seuils qmα y m ) dont la complexité algorithmique est de l ordre de 2 n ), nous réalisons des simulations de Monte-Carlo de la façon suivante. Nous générons B vecteurs i.i.d. w 1,..., w B de même loi que w, indépendamment de y. Nous considérons alors la région de rejet 2) où qmα y m ) est remplacé, pour tout m, par une version empirique : q B mα m ) = inf x R, 1 B } B 1I Πmw b y) α 2 n>x m. 4) b=1 2 Performances théoriques Les Théorèmes 2 et 3 de Durot et Rozenholc 2006) montrent que le niveau et la puissance du test construits avec les seuils définis par 4) sont similaires à ceux du test dont les seuils sont donnés en 3) lorsque B. Nous considérons donc seulement le test de région de rejet 2) avec q y mα m ) défini par 3). 2.1 Dans le cadre général Nous montrons tout d abord que notre test est de niveau non-asymptotique donné. 3

Théorème 1. Nous observons y = f + ε, où f R n et les ε i sont des variables aléatoires indépendantes, toutes de loi symétrique. Soit M une collection de partitions de 1,..., n}. Soient α et α m ) des réels positifs tels que α = α m. Alors, P H0 sup Πm y 2 n qmα y m ) } ) > 0 α. Les Théorèmes 4 et 5 de Durot et Rozenholc 2006) établissent des résultats de puissance du test dans le cadre général décrit ci-dessus, sous deux hypothèses de moment différentes. La première hypothèse envisagée est une condition de Bernstein : il existe des réels positifs γ et µ tels que pour tout entier p 1, max 1 i n Eε2p i ) γp!µ p 2. 5) La seconde hypothèse envisagée est que les moments sont bornés : il existe p 2 et µ > 0 tels que max 1 i n Eε2p i ) µ p. 6) Baraud et al. 2003) sont les rares à avoir considéré un cadre aussi général que le nôtre, mais ils posent l hypothèse supplémentaire que ε 1,..., ε n sont i.i.d. gaussiennes. Ce cas est couvert par nos hypothèses, qui ne supposent pas que ε 1,..., ε n sont gaussiennes, ni même que ces variables sont de même loi. La puissance de notre test est comparable à celle du test proposé par Baraud et al. 2003) dans le cas Gaussien. Le mérite de notre méthode est d être performant sous des hypothèses très générales. Considérer des hypothèses générales est rendu possible par le principe de calibration par symétrisation. 2.2 Dans le modèle de régression Nous nous plaçons dans le cadre du Théorème 1 ci-dessus et supposons de plus que f i = F x i ) pour tout i = 1,..., n, où x i [0, 1] est fixé et F : [0, 1] R est inconnue. Nous utilisons le test décrit plus haut pour tester H 0 : F 0 contre H 1 : F 0, en considérant pour M la collection des partitions dyadiques de 1,..., n}. D après ce qui précède, ce test est de niveau non-asymptotique α. Pour alléger, nous considérons seulement ici le cas où x i = i/n, α m = α/ M, et nous supposons qu il existe des réels positifs γ et µ tels qu on ait 5) pour tout entier p 1. Pour un réel β 0, 1) arbitraire, nous donnons dans le corollaire suivant des conditions suffisantes pour que la puissance du test soit au moins 1 β, c est-à-dire pour que P f sup Πm y 2 n qmα y m ) } ) > 0 1 β. 7) 4

Corollaire 1. Supposons qu il existe s 1/4, 1], R > 0 et L > 0 tels que u, v) [0, 1] 2, F u) F v) R u v s et sup F u) L. 8) u [0,1] Notons δ = γ + µ + L 2. Alors, il existe n 0 et C 0 ne dépendant que de α et β tels qu on ait 7) dès lors que n n 0, C C 0 et ) 2s/1+4s) δ log log n F 2 CR 1/1+4s). n La vitesse de séparation obtenue ici est exactement la vitesse minimax calculée par Spokoiny 1996) dans le modèle de bruit blanc et par Gayraud and Pouet 2005) dans le modèle de régression gaussienne. Ainsi, notre test atteint la vitesse optimale de séparation sous une condition de Bernstein si s > 1/4. Il atteint en fait la vitesse optimale de séparation dans des situations plus variées. 2.3 Preuve du Théorème 1. Cette courte preuve montre comment la symétrisation permet de calibrer un test dans une situation où la loi de la statistique de test n est pas connue sous H 0. Sous H 0, nous avons y = ε donc nous voulons démontrer que ) P sup Πm ε 2 n q ε mα m ) } > 0 α. 9) Pour tout u R n, soient u et sgnu) les vecteurs de R n dont les i-ème composantes sont respectivement u i et sgnu)) i = 1I ui >0} 1I ui <0}. 10) La loi de ε est symétrique et w ε = w sgnε) ε, donc la loi conditionnelle de w ε sachant ε est identique à la loi conditionnelle de w ε sachant ε. En particulier, q ε mα m ) = q ε m α m ), où q ε m α m ) = inf x R, P [ Π m w ε) 2 n > x ε ] α m }. Mais conditionnellement à ε, w ε a la même loi que sgnε) ε = ε. Donc, pour tout m M, P Π m ε 2 n > q ε mα m ) ε ) = P Π m w ε) 2 n > q ε m α m ) ε ) α m. 5

En intégrant l inégalité précédente, on obtient que On en déduit P sup P Π m ε 2 n > q ε mα m ) ) α m. Πm ε 2 n qmα ε m ) } ) > 0 P Π m ε 2 n > qmα ε m ) ) α m. Puisque par hypothèse, α m = α, on en déduit 9). Bibliographie [1] Baraud, Y., Huet, S., & Laurent, B. 2003). Adaptive tests of linear hypotheses by model selection. Annals of statistics, 225-251. [2] Durot, C., & Rozenholc, Y. 2006). An adaptive test for zero mean. Mathematical Methods of Statistics, 151), 26-60. [3] Gayraud, G., & Pouet, C. 2005). Adaptive minimax testing in the discrete regression scheme. Probability theory and related fields, 1334), 531-558. [4] Spokoiny, V. G. 1996). Adaptive hypothesis testing using wavelets. The Annals of Statistics, 246), 2477-2498. 6