Condition nécessaire et suffisante de convergence en loi de l estimateur des plus proches voisins

Documents pareils
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Limites finies en un point

Image d un intervalle par une fonction continue

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés

Probabilités III Introduction à l évaluation d options

Leçon 01 Exercices d'entraînement

I. Polynômes de Tchebychev

Économetrie non paramétrique I. Estimation d une densité

MESURE ET INTÉGRATION EN UNE DIMENSION. Notes de cours

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Texte Agrégation limitée par diffusion interne

Comparaison de fonctions Développements limités. Chapitre 10

4. Martingales à temps discret

Continuité en un point

aux différences est appelé équation aux différences d ordre n en forme normale.

Continuité et dérivabilité d une fonction

Intégrale de Lebesgue

Chapitre 7 : Intégration sur un intervalle quelconque

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

3 Approximation de solutions d équations

ÉTUDE ASYMPTOTIQUE D UNE MARCHE ALÉATOIRE CENTRIFUGE

La mesure de Lebesgue sur la droite réelle

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Développements limités. Notion de développement limité

Mesure et Intégration (Notes de cours de L3)

Travaux dirigés d introduction aux Probabilités

Théorie de la mesure. S. Nicolay

Continuité d une fonction de plusieurs variables

Suites numériques 3. 1 Convergence et limite d une suite

FIMA, 7 juillet 2005

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA


n N = u N u N+1 1 u pour u 1. f ( uv 1) v N+1 v N v t

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Commun à tous les candidats

Construction de l'intégrale de Lebesgue

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Mesures et Intégration

Développement décimal d un réel

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Capes Première épreuve

ENS de Lyon TD septembre 2012 Introduction aux probabilités. A partie finie de N

Théorie de la Mesure et Intégration

Moments des variables aléatoires réelles

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Cours Fonctions de deux variables

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Équations non linéaires

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Chp. 4. Minimisation d une fonction d une variable

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Amphi 3: Espaces complets - Applications linéaires continues

THÉORIE DE LA MESURE ET DE L INTÉGRATION.

Programmes des classes préparatoires aux Grandes Ecoles

8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2

C algèbre d un certain groupe de Lie nilpotent.

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours.

Développements limités usuels en 0

Calcul différentiel sur R n Première partie

Angles orientés et fonctions circulaires ( En première S )

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Introduction à la statistique non paramétrique

Techniques de Lyapunov en contrôle quantique pour le couplage dipolaire et polarisabilité

CCP PSI Mathématiques 1 : un corrigé

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

MÉTHODE DE MONTE CARLO.

Cours d Analyse I et II

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Théorème du point fixe - Théorème de l inversion locale

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

Probabilités sur un univers fini

Approximations variationelles des EDP Notes du Cours de M2

Algorithmes pour la planification de mouvements en robotique non-holonome

PROBABILITES ET STATISTIQUE I&II

Correction du baccalauréat S Liban juin 2007

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Exercice 1 Trouver l équation du plan tangent pour chaque surface ci-dessous, au point (x 0,y 0,z 0 ) donné :

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

CONCOURS COMMUN 2010 PHYSIQUE

Quantification Scalaire et Prédictive

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Yamina Yagoub-Zidi. Inconditionnalité et propriétés du point fixe dans les espaces de fonctions lisses

Espérance conditionnelle

«Cours Statistique et logiciel R»

Chapitre 3. Les distributions à deux variables

Intégration sur des espaces produits

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

Module d Electricité. 2 ème partie : Electrostatique. Fabrice Sincère (version 3.0.1)

Simulation de variables aléatoires

Mesures gaussiennes et espaces de Fock

Transcription:

Condition nécessaire et suffisante de convergence en loi de l estimateur des plus proches voisins Rémi Servien Laboratoire Jean Kuntzmann INP Grenoble Neuvième Colloque Jeunes Probabilistes et Statisticiens Mai 2010 Le Mont Dore 1 / 19

Plan de la présentation 1 Estimateur classique des k n plus proches voisins 2 Point de Lebesgue et ρ-régularité 3 Indice de régularité 4 Simulations 5 Conclusion 2 / 19

Estimateur classique des k n plus proches voisins S n = {X 1,..., X n } de v.a. iid sur R d tiré à partir d une mesure de probabilité µ Estimateur de la densité des k n -plus proches voisins : f kn (x) = k n nλ(b kn (x)) où B kn (x) est la plus petite boule de centre x contenant k n points de l échantillon. Estimateur convergent 3 / 19

Théorème (Moore et Yackel, 1977) Si f est continue et à dérivées bornées dans un voisinage de x avec f (x) > 0 et sous les conditions de convergence de f kn lim k n = et n et sous la condition supplémentaire alors la variable aléatoire lim n converge vers une loi N (0, 1). k n lim n n = 0 k n n 2/3 = 0 T n (x) = k n f kn (x) f (x) f (x) 4 / 19

Définitions x est un point de Lebesgue de la mesure µ si µ(b δ (x)) lim = f (x) existe. δ 0 + λ(b δ (x)) x est un point ρ-régulier de la mesure µ si µ(b δ (x)) λ(b δ (x)) f (x) ρ(δ), (1) où ρ est une fonction mesurable telle que lim δ 0 + ρ(δ) = 0 (Berlinet et Levallois, 2000). 5 / 19

Exemple On définit, pour x [ 1, 1] et x 0, la densité f 1 (x) = f 1(x) 0.2 0.3 0.4 0.5 0.6 x + 2 cos(1/x) + 2x sin(1/x) c 1.0 0.5 0.0 0.5 1.0 Condition nécessaire et suffisante de convergence x en loi de l estimateur des plus proches voisins 6 / 19

Exemple Discontinuité du 2nd ordre en 0. Mais µ 1 (B h (0)) 2h = 2 c + 2 3c h1/2 + o(h 1/2 ) 0 est un point de Lebesgue de la mesure µ 1 de densité f 1 7 / 19

Théorème (Berlinet et Levallois, 2000) Sous les conditions de convergence de f kn, si x est un point ρ-régulier de la mesure µ avec f (x) > 0, alors la condition kn ρ(r n (x)) P 0 lorsque n tend vers l infini implique la convergence en distribution de la variable aléatoire vers une loi N (0, 1). T n (x) = k n f kn (x) f (x) f (x) 8 / 19

Indice de régularité Si en x, point de Lebesgue de la mesure µ, nous avons µ(b δ (x)) λ(b δ (x)) = f (x) + C xδ αx + o(δ αx ) quand δ 0 +, (2) où C x 0 et α x > 0. L indice α x est appelé indice de régularité de la mesure µ au point x. 9 / 19

Exemple 1 f 1 (x) = x + 2 cos(1/x) + 2x sin(1/x) c µ 1 (B h (0)) 2h = 2 c + 2 3c h1/2 + o(h 1/2 ) 0 est un point de Lebesgue de la mesure µ 1 de densité f 1 avec un indice de régularité α 0 = 1/2. 10 / 19

Exemple 2 f 2 (x) = 1 2/3 + x si x [ 0.5, 0.5] f 2(x) 0.6 0.7 0.8 0.9 1.0 1.1 1.2 Pour µ 2 (x) on a : α x = 1 si x 0 α x = 0.5 si x = 0 0.4 0.2 0.0 0.2 0.4 x Caractère très fortement local de l indice de régularité 11 / 19

Exemple 3 1 f 3 (x) = + 1 a si x [ 0.5, 0.5]\0 log x = 1 a si x = 0 f 3(x) 0.4 0.6 0.8 1.0 1.2 1.4 1.6 0 est un point de Lebesgue de la mesure µ 3 On a ρ-régularité avec ρ(δ) = 1/ log δ Il n y a pas d indice de régularité en 0. 0.4 0.2 0.0 0.2 0.4 x 12 / 19

Théorème Si x est un point de Lebesgue où (2) est vérifié avec f (x) > 0, et sous les conditions de convergence de f kn, la variable aléatoire T n (x) = k n f kn (x) f (x) f (x) converge en loi si et seulement si la suite ( ) k 1+1/2αx n n a une limite finie κ. Lorsque cette condition est vérifiée, la loi asymptotique de T n (x) est ( ( ) ) C x κ αx 1 αx +1 N, 1. 2 αx f (x) 13 / 19

Exemple f 2 (x) = 1 2/3 + x si x [ 0.5, 0.5] Pour µ 2 (x) on a : α x = 1 si x 0 α x = 0.5 si x = 0 Sans prendre en compte la spécificité de f 2 en 0, on choisit k n = n pour n = 10000. 14 / 19

Exemple 0.0 0.1 0.2 0.3 0.4 x= 0.25 x= 0.125 x=0 x=0.125 x=0.25 2 0 2 4 6 15 / 19

f 2 (x) = 1 Simulations 2 3 + x, x [ 0.5, 0.5] Hypothèses du théorème : en 0 : k n << n 0.5 et k n << n 2/3 sinon. x = 0.25 0.125 0 0.125 k n = n 1/3 [0.74 ;1.25] [0.72 ;1.22] [0.34 ;0.55] [0.63,1.06] k n = n 2/5 [0.90 ;1.32] [0.66 ;0.96] [0.37 ;0.53] [0.65,0.94] k n = n 0.6 [1.02 ;1.05] [0.85 ;0.87] [0.55 ;0.56] [0.85 ;0.88] f 2 (x) 1.03 0.88 0.53 0.88 TABLEAU: Estimations de f 2 en différents points x pour n = 500000 points 16 / 19

Autre utilisation de l indice de régularité Estimateur de la densité des k n -plus proches voisins : f kn (x) = k n nλ(b kn (x)). Estimateur récursif (Beirlant, Berlinet et Biau (2008)) : f (r) k n (x) = f kn (x) a(d, k n, α x ). 17 / 19

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion Estimation de f 4 (x) = 0.5 exp( x ) en x = 0 0.0 0.2 0.4 0.6 0.8 1.0 0 200 400 600 800 1000 kn 18 / 19

Conclusion Condition nécessaire et suffisante pour la convergence en loi de f kn Problèmes : Pas d indice de régularité exact pour certaines fonctions ρ-régulières Indice de régularité difficile à calculer Définition inutilisable pour un rapport de mesures d ensembles non centrés au point d estimation x et n étant pas forcément des boules Nouvelle définition de l indice de régularité 19 / 19

Nouvelle définition On définit l ensemble E x par { E x = α 0 tel que C > 0, λ 0 > 0, tels que I I x vérifiant λ(i) < λ 0 } on ait µ(i) λ(i) f (x) Cλ(I) α où I x est l ensemble des intervalles contenant x. S il existe un réel α x vérifiant α x = sup E x (1) alors α x sera l indice de régularité de la mesure µ au point x. Si sup E x = + alors nous aurons α x = +. Estimation de régularité locale 1 / 6

Exemple 2 cos(1/x)+2x sin(1/x) f 4 (x) = c définie sur R pour x [ 1, 1]\0 avec c = 4 + 2 sin 1 et µ 1 sa mesure de probabilité associée. f 4(x) 0.2 0.3 0.4 0.5 0.6 1.0 0.5 0.0 0.5 1.0 x Estimation de régularité locale 2 / 6

En 0 : Point de Lebesgue ρ-régularité avec ρ(δ) = δ/c Pas d indice de régularité exact car µ 4 ([ h, h]) 2h f 4 (0) = 1 c h sin ( 1 h ) Utilisation de la nouvelle définition : α 0 = 1 Estimation de régularité locale 3 / 6

Théorème Si x est un point de Lebesgue où (1) est vérifié avec f (x) > 0 et α x E x, et sous les conditions de convergence de f kn, la condition supplémentaire lim n k 1+1/2αx n n = 0 implique la convergence asymptotique de la variable aléatoire vers une loi N (0, 1). T n (x) = k n f kn (x) f (x) f (x) Estimation de régularité locale 4 / 6

Application à l histogramme L histogramme s écrit f h (x) = ν nq nh n avec x Π nq, ν nq étant le nombre de points dans la qème cellule, q Z et h n un nombre réel positif dépendant de n. Si lim h n = 0 et lim nh n = +. (2) n n alors f h (x) L2 f (x). Estimation de régularité locale 5 / 6

Théorème Si x est un point de Lebesgue où (1) est vérifié avec f (x) > 0 et α x E x, et sous les conditions (2), la condition supplémentaire +1 lim nh2αx n n = 0 implique la convergence asymptotique de la variable aléatoire H n (x) = nh n f h (x) f (x) f (x) vers une loi N (0, 1). Estimation de régularité locale 6 / 6