Estimation spline de quantiles conditionnels pour variables explicatives fonctionnelles



Documents pareils
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Principe de symétrisation pour la construction d un test adaptatif

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Économetrie non paramétrique I. Estimation d une densité

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Chapitre 3. Les distributions à deux variables

NON-LINEARITE ET RESEAUX NEURONAUX

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Évaluation de la régression bornée

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Fonctions de plusieurs variables

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe

Table des matières. I Mise à niveau 11. Préface

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Programmes des classes préparatoires aux Grandes Ecoles

Laurent Delsol. Régression sur variable fonctionnelle : Estimation, Tests de structure et Applications.

3 Approximation de solutions d équations

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Limites finies en un point

Continuité et dérivabilité d une fonction

Modélisation géostatistique des débits le long des cours d eau.

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

Modèle GARCH Application à la prévision de la volatilité

Commun à tous les candidats

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions.

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Résolution d équations non linéaires

Introduction à la statistique non paramétrique

Cours d Analyse. Fonctions de plusieurs variables

Théorème du point fixe - Théorème de l inversion locale

Texte Agrégation limitée par diffusion interne

Résolution de systèmes linéaires par des méthodes directes

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CHAPITRE 5. Stratégies Mixtes

Chapitre 2 Le problème de l unicité des solutions

Exercices Corrigés Premières notions sur les espaces vectoriels

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Etude des propriétés empiriques du lasso par simulations

La fonction exponentielle

La mesure de Lebesgue sur la droite réelle

I. Polynômes de Tchebychev

Introduction à l approche bootstrap

Précision d un résultat et calculs d incertitudes

Calcul fonctionnel holomorphe dans les algèbres de Banach

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

Correction du Baccalauréat S Amérique du Nord mai 2007

Continuité d une fonction de plusieurs variables

Probabilités sur un univers fini

Correction de l examen de la première session

Probabilités sur un univers fini

Équation de Langevin avec petites perturbations browniennes ou

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

PROJET MODELE DE TAUX

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

Une approche non paramétrique Bayesienne pour l estimation de densité conditionnelle sur les rangs

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Dérivation : cours. Dérivation dans R

Modèles pour données répétées

Programmation linéaire et Optimisation. Didier Smets

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Simulation de variables aléatoires

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE

Calcul différentiel sur R n Première partie

F411 - Courbes Paramétrées, Polaires

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

La tarification d options

Représentation des Nombres

Introduction au Data-Mining

Le produit semi-direct

Introduction au Data-Mining

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Exercice : la frontière des portefeuilles optimaux sans actif certain

Chp. 4. Minimisation d une fonction d une variable

Dérivées d ordres supérieurs. Application à l étude d extrema.

Les indices à surplus constant

Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

1 Installer des packages

FIMA, 7 juillet 2005

TABLE DES MATIERES. C Exercices complémentaires 42

Régression linéaire. Nicolas Turenne INRA

Espérance conditionnelle

1 Complément sur la projection du nuage des individus

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

Transcription:

Estimation spline de quantiles conditionnels pour variables explicatives fonctionnelles Hervé Cardot 1, Christophe Crambes 2 & Pascal Sarda 2,3 1 INRA Toulouse, Biométrie et Intelligence Artificielle, Chemin de Borde-Rouge, BP 27, 31326 Castanet-Tolosan Cedex, France. 2 Université Paul Sabatier, Laboratoire de Statistique et Probabilités, UMR C5583, 118 Route de Narbonne, 31062 Toulouse Cedex, France. 3 Université Toulouse-le-Mirail, GRIMM, EA 2254, 5 allées Antonio Machado, 31058 Toulouse Cedex 9, France. Résumé : Ce travail a pour objet l estimation de quantiles conditionnels, la variable explicative X étant à valeurs dans l espace L 2 ([0, 1]) des fonctions de carré intégrable définies sur [0, 1] et la variable à expliquer Y étant à valeurs dans R. Ayant introduit un modèle linéaire, nous proposons un estimateur spline du coefficient fonctionnel du modèle qui minimise un critère pénalisé de type moindres valeurs absolues, puis nous étudions le comportement asymptotique de cet estimateur. Il s avère en particulier que le comportement de la plus petite valeur propre de l opérateur de covariance de X pénalisé joue un rôle important dans la convergence. Summary : This work deals with conditional quantiles estimation with the explanatory variable taking values in the space L 2 ([0, 1]) of square integrable functions defined on [0, 1] and a scalar response. Under the hypothesis of a linear model, we propose a spline estimator of the functional coefficient of the model that minimizes a penalized L 1 -type criterion, then we study the asymptotic behaviour of this estimator. The penalisation is of primary importance to get existence and convergence of the estimator. Mots-clés : variables fonctionnelles, quantiles conditionnels, fonctions B-splines, problème inverse mal conditionné, critère de type L 1 pénalisé. Key words : functional variables, conditional quantiles, B-spline functions, ill-conditioned inverse problem, penalized L 1 -type criterion. 1 Introduction Dans de nombreux exemples, les données collectées par les appareils de mesures peuvent être assimilées à des courbes, les mesures étant relevées sur des échelles temporelles ou spatiales très fines. Il est courant dans la littérature de qualifier ces données de données fonctionnelles (cf. Frank et Friedman, 1993, Ramsay et Silverman, 2002). De 1

nombreux modèles pour variables fonctionnelles ont été étudiés et mis en œuvre (cf. Ramsay et Silverman, 1997), comme par exemple le modèle linéaire fonctionnel dans le cadre de l estimation d une moyenne conditionnelle. Cependant, lorsqu on souhaite expliquer les variations d une variable en utilisant l information issue d une variable explicative, il est parfois préférable d estimer des quantiles conditionnels (cf. Poiraud-Casanova et Thomas-Agnan, 1998). Nous étudions ce problème d estimation dans le cas où la variable explicative est fonctionnelle. 2 Construction de l estimateur Soit (X i, Y i ) i=1,...,n un échantillon de couples indépendants de variables aléatoires définies sur un même espace de probabilités, de même loi que (X, Y ). La variable explicative X est à valeurs dans un espace fonctionnel H (dans la suite, H = L 2 ([0, 1]), l espace des fonctions de carré intégrable définies sur l intervalle [0, 1]), et Y est la variable aléatoire réponse à valeurs dans R. Soit α ]0, 1[ fixé ; nous supposons que pour tout x H, le quantile conditionnel d ordre α de Y sachant [X = x], noté g α (x), vérifie la relation P (Y g α (x) X = x) = α. (1) Remarquons que g α (x) peut être défini de manière équivalente comme solution du problème de minimisation min E(l α(y a) X = x), (2) a R où l α (u) = u + (2α 1)u (voir Koenker et Basset, 1978). Nous supposons enfin que g α est un opérateur linéaire continu de H dans R ; le théorème de Riesz nous assure l existence d une unique fonction Ψ α appartenant à H telle que g α (X) = Ψ α, X = 1 0 Ψ α (t)x(t) dt, (3) où la notation.,. désigne le produit scalaire usuel de L 2 ([0, 1]). La norme de L 2 ([0, 1]) associée à ce produit scalaire est notée.. Ce modèle est en quelque sorte une généralisation de la régression sur quantiles introduite par Koenker et Basset (1978). Notre but est à présent de proposer un estimateur non paramétrique de la fonction Ψ α. Dans le cas où la variable explicative X est réelle, de nombreux estimateurs ont été proposés (voir notamment Bhattacharya et Gangopadhyay, 1990, Fan, Hu et Truong, 1994, Lejeune et Sarda, 1988 ou encore He et Shi, 1994). Nous définissons ci-dessous un estimateur spline direct qui généralise celui de He et Shi (1994) au cas où la variable explicative X est de type fonctionnel. 2

Soit q N et k = k n N. On se donne k 1 nœuds (équirépartis dans la suite) définissant une subdivision de [0, 1] en k sous-intervalles. Une fonction spline (voir de Boor, 1978) est une fonction polynômiale de degré q par morceaux sur chaque sous-intervalle de [0, 1], et (q 1) fois dérivable sur [0, 1]. L espace de ces fonctions splines est un espace vectoriel de dimension k + q. Une base de cet espace vectoriel est l ensemble des fonctions B-splines, que l on notera B k,q = t (B 1,..., B k+q ). Nous estimons alors Ψ α par une combinaison linéaire des B l, 1 l k + q, ce qui nous ramène à trouver un vecteur θ = t ( θ 1,..., θ k+q ) R k+q tel que Ψ α = t B k,q θ, avec θ solution du problème de minimisation { 1 min θ R k+q n n ( l α Yi t B k,q θ, X i ) + ρ ( t B k,q θ) (m) }, 2 (4) i=1 où ( t B k,q θ) (m) est la dérivée d ordre m de t B k,q θ, ρ est un paramètre de pénalisation dont le but est de contrôler le degré de régularité de l estimateur cherché. Ce critère de minimisation est similaire à celui introduit par Cardot et. al. (2003) pour l estimateur spline de la moyenne conditionnelle, la fonction quadratique étant alors remplacée par la fonction de perte l α. Remarques (i) L opérateur g α permet de définir le modèle de régression sur quantiles Y i = g α (X i ) + ɛ i, i = 1,..., n, (5) où ɛ 1,..., ɛ n sont n variables aléatoires réelles, indépendantes et identiquement distribuées, de même loi que ɛ telle que P (ɛ 0 X = x) = α. (ii) Le terme de pénalisation dans (4) est primordial. En effet, si on note Γ X (resp. XY ) l opérateur de covariance de X (resp. l opérateur de covariance croisé de X et Y ), on vérifie alors facilement que, pour toute fonction u de L 2 ([0, 1]), XY u = g α (Γ X u) + E ( X E(X), u ɛ). (6) Comme Γ X est un opérateur nucléaire (voir Dauxois et. al., 1982), en particulier la suite de ses valeurs propres décroît vers 0, donc il n existe pas d inverse borné pour cet opérateur. Ainsi, la relation (6) aboutit sur un problème inverse mal conditionné. 3 Résultat asymptotique Nous nous intéressons maintenant à la convergence de cet estimateur. Pour cela, introduisons les notations suivantes. La version empirique de Γ X, notée Γ n, est définie en 3

remplaçant dans la définition de Γ X l espérance mathématique par la moyenne empirique. Nous utilisons également les mêmes notations que Cardot et. al. (2003) en désignant par Ĉ la matrice de taille (k + q) (k + q) de terme général Γ n (B j ), B l. De plus, si G k est la matrice de taille (k + q) (k + q) de terme général g jl = B (m) j, B (m) l, on pose Ĉ ρ = Ĉ + ρg k. La suite des valeurs propres de Ĉρ décroît vers 0, mais il est possible de contrôler la norme de son inverse, en introduisant l ensemble Ω n défini par } Ω n = {ω/λ min (Ĉρ) > cη n, (7) où λ min (Ĉρ) est la plus petite valeur propre de Ĉρ et (η n ) n N est une suite telle que P (Ω n ) tend vers 1 quand n tend vers l infini. En utilisant un résultat de Cardot et. al. (2003), on montre que, sous les hypothèses (H.1) et (H.3) ci-dessous, λ min (Ĉρ) cη n + o P ( (k 2 n n 1 δ ) 1/2), (8) avec δ ]0, 1[. Pour prouver le résultat de convergence de l estimateur Ψ α, on suppose que les hypothèses suivantes sont vérifiées. (H.1) X i C 0 < +, ps. (H.2) La fonction Ψ α a une dérivée d ordre p notée Ψ (p ) α telle que Ψ (p ) α (t) Ψ (p ) α (s) C 1 t s ν, s, t [0, 1], où C 1 > 0 et ν [0, 1]. Dans la suite, on pose p = p + ν et on suppose que q p m. (H.3) Les valeurs propres de Γ X sont strictement positives. (H.4) Pour tout x H, la distribution conditionnelle de ɛ i sachant X i admet une densité continue et strictement positive en zéro. Théorème 1 Sous les hypothèses (H.1) (H.4) et si on suppose de plus qu il existe β, γ, δ ]0, 1[ tels que k n n β, ρ n γ et η n n β (1 δ)/2 (δ étant donné par la relation (8)), alors (i) Ψ α existe sauf sur un ensemble dont la probabilité tend vers 0 lorsque n tend vers l infini, (ii) E ( ( Ψ α Ψ α 2 2 X ) 1 1,..., X n = OP kn 2p + 1 ) + ρ2 + ρkn 2(m p), nη n k n η n où. 2 est la norme induite par l opérateur Γ X, c est-à-dire que u 2 2 = Γ Xu, u pour tout u L 2 ([0, 1]). La preuve de ce résultat est donnée par Cardot et. al. (2004). 4

4 Quelques commentaires (i) La preuve du théorème 1 s inspire de la démonstration du résultat de He et Shi (1994) dans le cadre de variables explicatives réelles. De plus, des résultats de Cardot et. al. (2003) sont également utiles, notamment pour traiter le terme de pénalisation qui n apparaît pas dans le cas réel. Une autre différence provient du fait que la fonction de perte l α n est pas dérivable, contrairement à la fonction de perte quadratique dans le cas du modèle linéaire fonctionnel étudié par Cardot et. al. (2003). La preuve repose ici sur les propriétés de convexité de la fonction l α. (ii) Si on suppose que ɛ i et X i sont non corrélées, on obtient alors le résultat suivant (à la place du (ii) du théorème 1) : ( Ψ 1 α Ψ α 2 2 = O P kn 2p + 1 ) + ρ2 + ρkn 2(m p). nη n k n η n (iii) En choisissant des valeurs particulières de β et γ, on peut optimiser la vitesse de convergence obtenue au théorème 1. En particulier, nous remarquons l importance de la vitesse de convergence vers 0 de la plus petite valeur propre de Ĉρ (contrôlée par η n ). Cardot et. al. (2003) ont montré que, sous les hypothèses du théorème 1, la relation (8) est vérifiée avec η n = ρ/k n, ce qui donne E ( ( Ψ ) 1 α Ψ α 2 2 X 1,..., X n = OP kn 2p + k ) n nρ + ρ + ρk2(m p) n. Nous obtenons alors un corollaire immédiat en prenant k n n 1/(4p+1) et ρ n 2p/(4p+1) ; le résultat devient alors E ( Ψ α Ψ α 2 2 X 1,..., X n ) = OP ( n 2p/(4p+1) ). Il est possible d imaginer qu avec des hypothèses plus fortes sur les X i, nous pourrions obtenir η n plus grand que ρ/k n, ce qui améliorerait la vitesse de convergence de l estimateur (voir Cardot et Sarda, 2004). (iv) Cet estimateur de quantiles conditionnels peut se révéler très utile en pratique, spécialement pour la prévision par la médiane conditionnelle ou pour la recherche d un seuil. Il a notamment été mis en œuvre dans le cadre de l étude de données de pollution dans la région toulousaine. Par exemple, en considérant un polluant comme l ozone, il est possible de prévoir, par la médiane conditionnelle, le maximum d ozone du jour connaissant la courbe d ozone de la veille. 5

Bibliographie [1] Bhattacharya, P.K. and Gangopadhyay, A.K. (1990). Kernel and Nearest-Neighbor Estimation of a Conditional Quantile. Ann. Statist., 18, 1400-1415. [2] Cardot, H., Crambes, C. and Sarda, P. (2004). Spline Estimators of Conditional Quantiles for Functional Covariates, Preprint. [3] Cardot, H., Ferraty, F. and Sarda, P. (2003). Spline Estimators for the Functional Linear Model. Statistica Sinica, 13, 571-591. [4] Cardot, H. and Sarda, P. (2004). Estimation in Generalized Linear Models for Functional Data via Penalized Likelihood. J. of Mult. Analysis, in Press. [5] Dauxois, J., Pousse, A. and Romain, Y. (1982). Asymptotic Theory for the Principal Component Analysis of a Random Vector Function : some Applications to Statistical Inference. J. of Mult. Analysis, 12, 136-154. [6] de Boor, C. (1978). A Practical Guide to Splines. Springer, New-York. [7] Fan, J., Hu, T.C. and Truong, Y.K. (1994). Robust Nonparametric Function Estimation. Scand. J. Statist, 21, 433-446. [8] Frank, I.E. and Friedman, J.H. (1993). A Statistical View of some Chemometrics Regression Tools (with discussion). Technometrics, 35, 109-148. [9] He, X. and Shi, P. (1994). Convergence Rate of B-Spline Estimators of Nonparametric Conditional Quantile Functions. Nonparametric Statistics, 3, 299-308. [10] Koenker and Bassett (1978). Regression Quantiles. Econometrica, 46, 33-50. [11] Lejeune, M. and Sarda, P. (1988). Quantile Regression : A Nonparametric Approch. Comp. Stat. and Data Analysis, 6, 229-239. [12] Poiraud-Casanova, S. et Thomas-Agnan, C. (1998). Quantiles Conditionnels. Journal de la Société Française de Statistique, 139, 31-44. [13] Ramsay, J.O. and Silverman, B.W. (1997). Functional Data Analysis. Springer-Verlag. [14] Ramsay, J.O. and Silverman, B.W. (2002). Applied Functional Data Analysis. Springer- Verlag. 6