Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier



Documents pareils
Principe de symétrisation pour la construction d un test adaptatif

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

NON-LINEARITE ET RESEAUX NEURONAUX

Équation de Langevin avec petites perturbations browniennes ou

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Économetrie non paramétrique I. Estimation d une densité

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Etude des propriétés empiriques du lasso par simulations

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Tests exacts d indépendance sérielle dans les cas de distributions continues et discrètes

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Principe d un test statistique

Introduction à la statistique non paramétrique

Introduction à l approche bootstrap

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions.

Forthcoming Database

Louis Laurencelle, a vol. 11 no. 1. Introduction

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

3 Approximation de solutions d équations

TABLE DES MATIERES. C Exercices complémentaires 42

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

Chapitre 7 : Intégration sur un intervalle quelconque

Christian BONTEMPS né le 08 juillet 1969

Utilisation du Logiciel de statistique SPSS 8.0

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Equation LIDAR : exp 2 Equation RADAR :

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Modèles pour données répétées

Programmes des classes préparatoires aux Grandes Ecoles

I. Polynômes de Tchebychev

IFT3245. Simulation et modèles

Modèle GARCH Application à la prévision de la volatilité

Économétrie, causalité et analyse des politiques

Exemple PLS avec SAS

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Introduction aux Statistiques et à l utilisation du logiciel R

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Analyse de la variance Comparaison de plusieurs moyennes

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Dans ce document, on décrit les indices des prix des biens de la TIC qui sont produits, ainsi que les sources de données et la méthodologie.

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Probabilités III Introduction à l évaluation d options

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Texte Agrégation limitée par diffusion interne

Le modèle de Black et Scholes

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

TESTS D'HYPOTHESES Etude d'un exemple

Christian BONTEMPS né le 08 juillet 1969

Simulation de variables aléatoires

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Modélisation géostatistique des débits le long des cours d eau.

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Continuité d une fonction de plusieurs variables

MATHÉMATIQUES FINANCIÈRES

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Chapitre 2 Le problème de l unicité des solutions

Loi binomiale Lois normales

Méthodes de Simulation

Jean-Baptiste AUBIN Maître de Conférence en Statistique

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test

Nombres premiers. Comment reconnaître un nombre premier? Mais...

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Commun à tous les candidats

Continuité et dérivabilité d une fonction

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Estimation et tests statistiques, TD 5. Solutions

TSTI 2D CH X : Exemples de lois à densité 1

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Précision d un résultat et calculs d incertitudes

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Une méthode d apprentissage pour la composition de services web

Résolution de systèmes linéaires par des méthodes directes

Cours de Tests paramétriques

Moments des variables aléatoires réelles

INSERTION TECHNIQUES FOR JOB SHOP SCHEDULING

Biostatistiques : Petits effectifs

Analyse de la dynamique d un lit fluidisé gaz-solide en interaction acoustique avec son système de ventilation : comparaison théorie/expérience.

1 Définition de la non stationnarité

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Transcription:

Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier Zaher Mohdeb Université Mentouri Département de Mathématiques, Constantine, Algérie E-mail: zaher.mohdeb@umc.edu.dz Résumé. Dans ce travail, nous proposons une nouvelle méthode de comparaison de deux fonctions de régression f 1 et f 2 dans le cas homoscédastique et un échantillonnage fixé. Notre approche est basée sur les coefficients de Fourier empiriques des fonctions de régression respectivement de f 1 et f 2. On obtient la distribution asymptotique de la statistique de test proposée, sous l hypothse nulle f 1 = f 2 ainsi que sous les alternatives globales et locales. Une étude par simulation est menée pour montrer la performance du test proposé. Mots-clés. Régression non paramétrique, test d égalité, coefficient de Fourier empirique. Abstract. In this work we propose a new methodology for the comparison of two regression functions f 1 and f 2 in the case of homoscedastic error structure and a fixed design. Our approach is based on the empirical Fourier coefficients of the regression functions f 1 and f 2 respectively. We obtain the asymptotic distribution of the test statistic under the null hypothesis f 1 = f 2 and local and global alternatives. A simulation study is conducted to investigate the finite sample performance of our test. Keywords. Nonparametric regression, test of equality, empirical Fourier coefficient. 1 Introduction On considère les deux modèles de régression non paramétriques donnés par Y l,j = f l (t j ) + ε l,j, l = 1, 2 et j = 1,..., n, (1) où t j = j/n; pour l = 1, 2, f l : [0, 1] IR, est une fonction réelle inconnue et les erreurs (ε l,j ) j=1,...,n, sont des variables aléatoires i.i.d. centrées et de variance finie σ 2 l. En outre, les erreurs aléatoires (ε l,j ) j=1,...,n, l = 1, 2 sont supposées indépendantes. L objet de ce travail est de construire le test d hypothèse d égalité des fonctions de régression f 1 et f 2, c est-à-dire: H 0 : f 1 = f 2 contre H 1 : f 1 f 2. (2) 1

Le problème de test d égalité de fonctions de régression a fait l objet de plusieurs travaux dans la litérature. On citera, sans être exhaustif, Härdle et Marron (1990), Delgado (1993), Bowman et Young (1996), Hall, Huber et Speckman (1997), Kulasekera et Wang (1998), Munk et Dette (1998), Mohdeb et Mokkadem (2001), Neumeyer et Dette (2003), Vilar- Fernández et González-Mantega (2003), Vilar-Fernández, Vilar-Fernández et González- Mantega (2007). L objet de notre travail porte sur la construction du test d hypothèses (2) basé sur les coefficients de Fourier des fonctions de régression f 1 et f 2. Plus précisément, soient 1 c l,k = e 2πikt f l (t) dt, l = 1, 2 et k ZZ 0 les coefficients de Fourier de f l, l = 1, 2. Le test (2) se ramène au test suivant H 0 : c 1,k = c 2,k, k ZZ contre H 1 : k ZZ tel que c 1,k c 2,k. (3) Comme f l, l = 1, 2, est à valeurs réelles, on a c l,k = c l, k pour tout k IN; par conséquent tout test sur les coefficients de Fourier de f l se ramène au test sur les c l,k, k 0. En particulier, l hypothèse nulle H 0 est équivalente à c 1,k = c 2,k, k IN. Il s ensuit, clairement, que H 0 est vraie si et seulement si k IN c 1,k c 2,k 2 = 0. La statistique de test, que nous utilisons, est basée sur les estimateurs empiriques ĉ l,k de c l,k définis par ĉ l,k = 1 n Y l,j e 2πikj/n, l = 1, 2 n j=1 et on considère une suite de nombres entiers p = p(n) tels que lim p(n) =. n statistique de test est alors basée sur ˆT n,p = k p ĉ 1,k ĉ 2,k 2 et on rejette H 0 si ˆT n,p > t α où t α est un nombre réel positif déterminé par le niveau α du test. Dans notre approche, la statistique de test est utilisée pour tester des hypothèses sur les coefficients de Fourier de f l, l = 1, 2. Pour construire le test, nous avons besoin d estimer la variance σ 2 l, l = 1, 2. Dans le présent travail, nous utilisons l estimateur proposé par Rice (1984). Une étude sur des simulations est menée pour montrer la performance du test proposé. La 2 Hypothèses et résultats On s intéresse au test (3) pour le modèle (1) et on suppose que pour l = 1, 2 2

f l est Lipschitzienne d ordre δ, avec 1 2 < δ 1. ε l,j, j = 1,..., n sont des variables aléatoires réelles i.i.d. d espérance nulle et de variance inconnue σ 2 l. La convergence en loi est notée par telle que p(n) = +. lim n + L. On introduit une suite d entiers p = p(n) 2.1 Comportement asymptotique des coefficients de Fourier empiriques On introduit les hypothèses suivantes, (A1): ε l,1 { N (0, σl 2 ), l = 1, 2. (A2): n 2δ+1 p(n) } = 0. lim n + Théorème 1 Si (A1) et (A2) sont vérifiées, alors n k p (ĉ 1,k ĉ 2,k ) (c 1,k c 2,k ) 2 (2p + 1)(σ1 2 + σ2) N (0, 1). (σ1 2 + σ2) Puisque la région de rejet est définie par ˆT n,p = k p ĉ 1,k ĉ 2,k 2 > t α, le théorème précédent permet de déterminer le niveau et la puissance du test lorsque la variance des erreurs est connue. La question qui se pose dans le cas non paramétrique est de savoir quelles sont les alternatives proches de H 0 qui peuvent être distinguées de l hypothèse nulle. Suivant Eubank et Spiegelman (1990), on considère les alternatives locales c 1,k c 2,k = h(n)e k, k p, où lim h(n) = 0 et e k est le k-ième coefficient de Fourier d une n fonction m Lipschitzienne d ordre δ > 1, on obtient: 2 Proposition 1 On se place sous les hypothèses du théorème 1 et on considère h(n) = p 1/4 n 1/2. On a alors sous les alternatives locales c 1,k c 2,k = h(n)e k, k p, n k p ĉ 1,k ĉ 2,k 2 (2p + 1)(σ1 2 + σ2) (σ1 2 + σ2) N 1 e 2(σ1 2 + σ2) 2 k 2, 1. k IN Ce qui signifie que le test peut détecter les alternatives locales convergeant vers l hypothèse nulle avec une vitesse plus petite que p 1/4 n 1/2. 3

2.2 Construction du test Le résultat du théorème 1 permet de construire le test quand les variances σl 2, l = 1, 2, sont connues; cependant en pratique les σl 2 sont inconnues et il faut donc les estimer. On peut utiliser l estimateur donné par Gasser, Sroka et Jennen-Steinmetz (1986); dans le présent travail, on utilise l estimateur proposé par Rice (1984), défini par ˆσ 2 l = 1 2(n 1) n (Y l,j Y l,j 1 ) 2, l = 1, 2. (4) j=2 On peut montrer que le théorème 1 reste vrai en remplaçant σ 2 l par ˆσ 2 l, l = 1, 2. Corollaire 1 Si (A1) et (A2) sont vérifiées, alors sous H 0 : f 1 = f 2,, on a: n k p ĉ 1,k ĉ 2,k 2 (2p + 1)(ˆσ 1 2 + ˆσ 2) N (0, 1). (ˆσ 1 2 + ˆσ 2) Ces résultats donnent le niveau de signification lorsque les fonctions de régression sont Lipschitziennes sous l hypothèse nulle, ainsi que la puissance du test pour les alternatives également Lipschitziennes. 3 Simulation Une étude par simulation est menée afin de montrer la performance du test proposé. On étudie les puissances empiriques du test d hypothèses (2), avec f 1 (t) = t et deux formes différentes respectivement pour les alternatives f 2 : f (1) 2 (t) = βte 2t et f (2) 2 (t) = βt 2, pour plusieurs choix de β sur l intervalle [0, 2]. Bibliographie [1] Bowman A. and Young, S. (1996). Graphical comparison of nonparametric curves. Appl. Statist., 45, 83-98. [2] Delgado, M. A. (1993). Testing the equality of nonparametric regression curves, Statist. Probab. Lett., 17, 199-204. [3] Eubank R. L. and Spiegelman, C. H. (1990). Testing the goodness-of-fit of a linear model via nonparametric regression techniques. J. Amer. Stat. Assoc., 85, 410, 387-392. [4] Gasser, T., Sroka L. and Jennen-Steinmetz, C. (1986). Residual variance and residual pattern in nonlinear regression. Biometrika, 73, 625-633. 4

[5] Hall, P., Huber, C. and Speckman, P. L. (1997). Covariate-matched one-sided tests for the difference between functional means. J. Amer. Statist. Assoc., 92, 1074-1083. [6] Härdle, W. and Marron, J. S. (1990). Semiparametric comparison of regression curves. Ann. Statist., 18, 63-89. [7] Kulasekera K. B. and Wang, J. (1998). Bandwidth selection for power optimality in a test of equality of regression curves. Stat. Probab. Lett., 37, 287-293. [8] Mohdeb, Z. and Mokkadem, A. (2001). Testing Hypotheses On Fourier Coefficients in Nonparametric Regression Model. Journal of Nonparametric Statistics, 13, 605-629. [9] Munk, A. and Dette, H. (1998). Nonparametric comparison of several regression functions: Exact and asymptotic theory. Ann. Statist., 26, 2339-2368. [10] Neumeyer N. and Dette, H. (2003). Nonparametric comparison of regression curves: an empirical process approach. Ann. Statist., 31, 3, 880-920. [11] Rice, J. A. (1984). Bandwidth choice for nonparametric regression. Ann. Statist., 12, 1215-1230. [12] Vilar-Fernández J. M. and González-Manteiga, W. (2003). Nonparametric comparison of curves with dependent errors. Statistics, 38, 2, 81-99. [13] Vilar-Fernández, J. M., Vilar-Fernández J. A. and González-Manteiga, W. (2007). Bootstrap tests for nonparametric comparison of regression curves with dependent errors. Test, 16, 123-144. 5