Utilisation du bootstrap pour les problèmes statistiques liés à l estimation des paramètres



Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

Chapitre 3 : Fonctions d une variable réelle (1)

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Limites des Suites numériques

SÉRIES STATISTIQUES À DEUX VARIABLES

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

EXERCICES : DÉNOMBREMENT

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

UNIVERSITÉ DE SFAX École Supérieure de Commerce

1 Mesure et intégrale

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Cours de Statistiques inférentielles

Principes et Méthodes Statistiques

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Statistique descriptive bidimensionnelle

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Chap. 5 : Les intérêts (Les calculs financiers)

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Dénombrement. Chapitre Enoncés des exercices

Échantillonnage et estimation

14 Chapitre 14. Théorème du point fixe

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

55 - EXEMPLES D UTILISATION DU TABLEUR.

Module 3 : Inversion de matrices

Comportement d'une suite

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Séquence 5. La fonction logarithme népérien. Sommaire

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Formation d un ester à partir d un acide et d un alcool

Cours 5 : ESTIMATION PONCTUELLE

Processus géométrique généralisé et applications en fiabilité

Séries réelles ou complexes

2 ième partie : MATHÉMATIQUES FINANCIÈRES

CHAPITRE 2 SÉRIES ENTIÈRES

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

20. Algorithmique & Mathématiques

Chapitre 3 : Transistor bipolaire à jonction

STATISTIQUE AVANCÉE : MÉTHODES

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

4 Approximation des fonctions

Initiation à l analyse factorielle des correspondances

Etude de la fonction ζ de Riemann

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Université Pierre et Marie Curie. Biostatistique PACES - UE

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Les algorithmes de tri

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Comment les Canadiens classent-ils leur système de soins de santé?

Processus et martingales en temps continu

Suites et séries de fonctions

Solutions particulières d une équation différentielle...

Les Nombres Parfaits.

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Statistique Numérique et Analyse des Données

Exercices de mathématiques

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Risque de longévité et détermination du besoin en capital : travaux en cours

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Mécanismes de protection contre les vers

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Gérer les applications

Protection de votre réseau d entreprise:

Baccalauréat S Asie 19 juin 2014 Corrigé

La maladie rénale chronique

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Compte Sélect Banque Manuvie Guide du débutant

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Régulation analogique industrielle ESTF- G.Thermique

Probabilités et statistique pour le CAPES

Des résultats d irrationalité pour deux fonctions particulières

Le chef d entreprise développe les services funéraires de l entreprise, en

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

Neolane Message Center. Neolane v6.0

Neolane Leads. Neolane v6.0

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Microscope de mesure sans contact pour inspection et mesures de précision

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Terminale S. Terminale S 1 F. Laroche

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Transcription:

B A S E Biotechol Agro Soc Eviro 00 6 (3) 43 53 Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres Rudy Palm Uité de Statistique et Iformatique Faculté uiversitaire des Scieces agroomiques de Gembloux Aveue de la Faculté d Agroomie 8 B 5030 Gembloux (Belgique) E-mail : palmr@fsagxacbe Reçu le 7 mars 00 accepté le 9 avril 00 Cet article décrit l utilisatio du bootstrap pour le calcul de l erreur-stadard et du biais d u estimateur et pour la détermiatio des limites de cofiace d u paramètre estimé Les différetes méthodes exposées sot illustrées par u exemple Mots-clés Bootstrap erreur-stadard biais itervalle de cofiace jackkife moyee médiae variace statistique Use of bootstrap for statistical problems related to estimatio of parameters This paper describes bootstrappig for the estimatio of the stadard error ad the bias of a estimator ad for computig cofidece itervals The methods are illustrated by a example Keywords Bootstrap stadard error bias cofidece iterval jackkife mea media variace statistics INTRODUCTION Les méthodes classiques d iférece statistique e permettet pas d obteir des réposes correctes à tous les problèmes cocrets que se pose l utilisateur Elles e sot e effet valables que sous des coditios d applicatio particulières Aisi par exemple le test t de Studet d égalité des moyees suppose que les deux populatios-parets sot ormales de même variace et que les deux échatillos sot aléatoires simples et idépedats Le calcul de l itervalle de cofiace d ue variace par l itermédiaire des variables χ suppose que la populatio-paret est ormale et que l échatillo est aléatoire et simple L iférece statistique classique e régressio suppose outre les coditios d applicatio relatives à la populatio et à l échatillo que le modèle est ajusté au ses des moidres carrés Que peut faire l utilisateur e pratique lorsque ces coditios d applicatio e sot pas remplies? Différetes attitudes sot possibles Das certais cas les méthodes classiques sot utilisées malgré le o-respect des coditios Cette utilisatio est alors justifiée par le caractère robuste des méthodes qui garatit que les résultats de l iférece restet approximativemet valables C est par exemple le cas pour la comparaiso de moyees de populatios qui s écartet modérémet des distributios ormales lorsque les effectifs sot suffisammet grads Le recours à des trasformatios de variables permet das certais cas de se rapprocher des coditios d applicatio Aisi ue trasformatio logarithmique par exemple peut redre ormales des distributios qui au départ e le sot pas Ue troisième attitude cosiste à abadoer les méthodes paramétriques d iférece statistique au profit de méthodes o paramétriques pour lesquelles les coditios d applicatio sot bie mois restrictives Pour le problème de la comparaiso de deux moyees évoqué ci-dessus le test t de Studet sera par exemple remplacé par le test des rags de Wilcoxo aussi appelé test de Ma-Whitey (Dagelie 998) Les solutios proposées ci-dessus permettet icotestablemet d élargir l évetail des problèmes auxquels ue solutio peut être apportée Elles e permettet cepedat pas de résoudre tous les problèmes L accès gééralisé à des moyes de calcul puissats a permis le développemet de méthodes d iférece statistique basées sur l utilisatio itesive de l ordiateur Le bootstrap fait partie de ces méthodes Le mot bootstrap proviet de l expressio aglaise to pull oeself up by oe s bootstrap (Efro Tibshirai 993) qui sigifie littéralemet se soulever e tirat sur les laguettes de ses bottes Le mot bootstrap fait peser à des traductios telles que à la force du poiget ou par soi-même ou passe partout (Dagelie 998) mais e fait il est jamais traduit das la littérature scietifique d expressio fraçaise

44 Biotechol Agro Soc Eviro 00 6 (3) 43 53 R Palm Le pricipe gééral de la méthode est de rééchatilloer u grad ombre de fois l échatillo iitial qui a été réellemet prélevé das la populatio l iférece statistique état basée sur les résultats des échatillos aisi obteus L objectif de cette ote est de décrire commet le bootstrap peut être utilisé pour résoudre les problèmes d iférece statistique e relatio avec l estimatio des paramètres Nous présetos d abord les méthodes de rééchatilloage Esuite ous examios l estimatio de l erreur-stadard et du biais d u estimateur Nous doos alors quelques méthodes de détermiatio de l itervalle de cofiace d u paramètre avat de coclure Des iformatios plus détaillées cocerat le bootstrap et d autres méthodes de rééchatilloage sot doées otammet par Cherick (999) Efro et Tibshirai (993) et Maly (997) MÉTHODES DE RÉÉCHANTILLONNAGE Bootstrap des idividus O cosidère u échatillo de observatios : x x x i x prélevé de maière aléatoire et simple das ue populatio Ces observatios peuvet cocerer ue seule variable ou au cotraire être relatives à plusieurs variables Das ce cas les x i représetet des vecteurs de dimesio p p état le ombre de variables Afi de e pas alourdir les otatios ous e distigueros pas ces deux situatios et de maière plus codesée ous désigeros l échatillo iitial par le symbole x qu il s agisse d u vecteur ou d ue matrice Le pricipe de la méthode du bootstrap est de prélever ue série d échatillos aléatoires et simples avec remise de observatios das l échatillo iitial cosidéré comme ue populatio Ces échatillos successifs serot otés : x * x * Kx k * K x B * B état le ombre de rééchatilloages effectués À titre d illustratio ous cosidéros le problème de l estimatio de diverses caractéristiques de la populatio des tailles des exploitatios agricoles de la Régio walloe à partir d u échatillo aléatoire et simple de 00 observatios La populatio a été simulée à partir de la distributio groupée résultat du recesemet agricole et horticole au 5 mai 995 (INS 996) Pour ue classe doée d effectif i et de limites de classe x i if et x i sup o a gééré i ombres aléatoires apparteat à ue distributio uiforme das le domaie (x i i f x i s u p ) O a aisi obteu les tailles simulées des 479 exploitatios La figure repred l histogramme et 003 00 00 000 Effectif: 479 Moyee: 309 Médiae: 5 Variace 04 0 00 00 300 Surface agricole utile (ha) Figure Populatio simulée des tailles des exploitatios de la Régio walloe e 995 Simulated populatio of the farms sizes i the Walloo Regio i 995 les pricipaux paramètres de cette populatio dot la caractéristique la plus marquate est la très forte dissymétrie gauche L exemple présete doc u caractère artificiel das la mesure où o coaît exactemet les caractéristiques de la populatio celle-ci état simulée L itérêt de disposer d ue populatio est de permettre ue répétitio des calculs comme ous le verros au paragraphe 47 Das la populatio théorique e questio o a sélectioé de maière aléatoire et simple u échatillo de 00 observatios La deuxième coloe du tableau otée x doe les premières et les derières observatios de l échatillo après classemet des doées par ordre croissat Les trois coloes suivates doet les premières et les derières observatios de trois échatillos de 00 observatios prélevés das l échatillo iitial et otés x * x * x 3 * ceux-ci ayat égalemet été classés par ordre croissat O costate par exemple que pour l échatillo x * la première observatio de l échatillo iitial a été sélectioée deux fois et que Ta b l e a u Échatillo iitial x et résultats de trois rééchatilloages x * x * et x 3 * (doées partielles) Iitial sample x ad three bootstrap samples x * x * ad x 3 *(partial data) Numéro x x * x * x 3 * d ordre 000 000 000 000 08 000 000 000 3 036 036 08 036 4 046 04 08 036 97 968 8555 968 96 98 9860 8555 9860 968 99 3360 96 3360 9860 00 45 968 3360 9860

Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres 45 la deuxième observatio de l échatillo iitial a par cotre pas été sélectioée Le rééchatilloage se faisat avec remise il est tout à fait ormal que certaies observatios de l échatillo iitial soiet absetes ou au cotraire apparaisset plus d ue fois Pour l esemble des B échatillos obteus par b o o t s t r a p (bootstrap sample) les observatios x i apparaisset pas e ombre égal et o peut défiir les proportios d apparitio P i * de chacue des observatios P i * état égal au ombre de fois que l observatio x i a été prélevée pour l esemble des B échatillos divisé par le ombre total de prélèvemets qui est égal à B Ces proportios P i * itervieet das certaies estimatios (paragraphe 3) Des méthodes de rééchatilloage assurat l égalité de ces proportios sot égalemet proposées Cette approche porte le om de rééchatilloage balacé Bootstrap des résidus La techique de rééchatilloage présetée ci-dessus est la plus simple et la plus courate Des méthodes u peu différetes sot utilisées pour des applicatios particulières Aisi das les problèmes de régressio lorsque les valeurs des variables explicatives sot fixées a priori par l utilisateur le rééchatilloage d idividus peut difficilemet se justifier Das ue telle situatio o peut remplacer le bootstrap des idividus par le bootstrap des résidus Soit y le vecteur de la variable à expliquer et Z la matrice des variables explicatives L échatillo iitial est doc décrit par la juxtapositio du vecteur y et de la matrice Z Soit β^ le vecteur des coefficiets estimés par ue méthode doée d ajustemet qui est pas écessairemet la méthode des moidres carrés O peut calculer le vecteur des valeurs estimées de la variable à expliquer et e déduire le vecteur des résidus : e = y - ˆy Das le cas du modèle liéaire o a : ˆy = Z βˆ mais de maière plus géérale y i peut être ue foctio quelcoque des valeurs observées des variables explicatives et des paramètres estimés : ( Z βˆ ) ˆ y = f Soit e k * u échatillo aléatoire et simple prélevé avec remise das le vecteur e Si le vecteur e est pas de moyee ulle il est écessaire de soustraire cette moyee de chacu des résidus avat de procéder au rééchatilloage (Léger et al 99) E additioat e k * à la partie détermiiste du modèle f (Zβ^ ) o obtiet le vecteur y k *: La juxtapositio de y k * et de Z costitue le résultat du rééchatilloage x k * Comme précédemmet la procédure décrite est répétée B fois Il faut oter que l applicatio du bootstrap à la régressio implique pas écessairemet le bootstrap des résidus Le choix de l ue ou de l autre méthode déped du caractère fixe ou aléatoire de la matrice Z mais déped aussi des hypothèses relatives au modèle Le rééchatilloage des résidus suppose e effet que les résidus e sot pas foctio des variables explicatives ce qui est par exemple pas le cas e présece d iégalité des variaces coditioelles ou d iadéquatio de la relatio 3 ERREUR-STANDARD ET BIAIS D UN PARAMÈTRE 3 Estimatio de l erreur-stadard Soit u paramètre θ de la populatio et soit : ( x x ) f ( x) = f K ( Z ) e* k y * ˆ k = f β + = ue estimatio de ce paramètre obteue à partir des doées de l échatillo iitial x Chaque échatillo obteu par rééchatilloage permet de calculer ue répétitio du b o o t s t r a p (bootstrap replicatio) de l estimatio θ^ : f ( * k ) ( k B) k = x = K la foctio f état la même que celle utilisée pour la défiitio de θ^ Cosidéros qu o s itéresse à la moyee à la médiae et à la variace de la distributio des tailles des exploitatios agricoles et qu o se propose d estimer ces trois paramètres à partir de l échatillo x Si o utilise les estimateurs classiques le paramètre θ^ s écrit successivemet pour les trois paramètres cosidérés : = 00 x xi ~ x = ( x[50] + x[5 ) 00 i= ] 00 σ et ˆ = ( x ) 99 i x i= x [50] et x [5] état les observatios de rags 50 et 5 de l échatillo iitial Les valeurs umériques pour ces trois estimatios sot doées das la première partie du tableau sur la lige ititulée θ^

46 Biotechol Agro Soc Eviro 00 6 (3) 43 53 R Palm Tableau Paramètres estimés pour l échatillo iitial (θ^ ) et pour les trois premiers échatillos obteus par rééchatilloage (θ^* θ^* et θ^3*) ; moyees (θ^*) et écarts-types (σ^θ^*) des paramètres estimés pour 000 rééchatilloages Parameters estimated from the iitial sample (θ^ ) ad from the first three bootstrap samples (θ^* θ^* et θ^3*) ; meas (θ^*) ad stadard deviatios (σ^θ^*) for 000 bootstrap replicates Paramètre Moyee Médiae Variace θ^ Les calculs des trois paramètres peuvet être répétés pour les échatillos x * x *et x 3 * Les résultats obteus sot repris das la secode partie du tableau sur les liges ititulées θ^ * θ^*et θ^ 3* Cette secode partie du tableau peut évidemmet être complétée au fur et à mesure des rééchatilloages fourissat x 4 * x 5 * x B * Disposat des B répétitios o peut détermier la moyee : B ˆ θ = θ ˆ B k k= et l écart-type des θ^k*: σˆ θ ˆ * 83 56 85463 θ^* 784 89 6679 θ^* 63 995 79693 θ^3* 3 35 7086 θ^* 799 044 84358 σ^θ^* 89 53 845 = B ( ˆ* ˆ θ * k θ ) ( B ) k = Pour l exemple ci-dessus 000 rééchatilloages ot été réalisés Les f i g u res 3 et 4 doet la distributio des valeurs obteues pour les trois paramètres cosidérés Pour la moyee et pour la variace o costate que la distributio est e cloche et relativemet symétrique Par cotre la distributio des médiaes est assez différete puisqu elle présete u caractère bimodal assez proocé La moyee et l écart-type des 000 moyees des 000 médiaes et des 000 variaces sot doés das la troisième partie du tableau das les liges ititulées θ^* et σ^ θ^* L écart-type σ^θ^* est ue estimatio de l erreurstadard de l estimateur du paramètre θ Pour les situatios où o dispose d u estimateur de cette erreur-stadard et pour autat que les coditios d applicatio soiet remplies o peut motrer que 05 00 005 000 0 5 30 35 Moyee Figure Distributio des moyees de 000 échatillos obteus par bootstrap Distributio of the meas of 000 bootstrap samples 05 00 05 00 005 000 0 5 0 5 30 Médiae Figure 3 Distributio des médiaes de 000 échatillos obteus par bootstrap Distributio of the medias of 000 bootstrap samples 0005 0000 0005 0000 00005 00000 500 750 000 50 500 Variace Figure 4 Distributio des variaces de 000 échatillos obteus par bootstrap Distributio of the variaces of 000 bootstrap samples

Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres 47 l écart-type des θ^k* ted vers le résultat aalytique lorsque B ted vers l ifii Aisi pour la moyee d u échatillo aléatoire et simple o sait que l erreur-stadard de la moyee est égale à σ Si B ted vers l ifii l écart-type σ^θ^* ted vers σ avec : ˆ plug L estimatio σ^ plug de l écart-type de la populatio doée ci-dessus est appelée estimatio par isertio (plug-i estimator) Pour u estimateur par isertio la formule coduisat à l estimatio est la même que celle utilisée pour la défiitio du paramètre de la populatio E effet pour ue populatio fiie de taille N et de moyee m X o a : = N N E d autres mots pour u estimateur par isertio o cosidère l échatillo comme ue populatio particulière et o utilise la formule relative au paramètre de la populatio Pour l exemple ci-dessus l écart-type des moyees obteues pour les différets échatillos x k * est égal à 89 (Ta b l e a u ) Si o augmetait idéfiimet le ombre de répétitios B cet écart-type se rapprocherait de 9 puisque : ( ) ˆ = ( 99)( 854 63) 00 846 08 σˆ plug = σ = et σˆ 846 08 00 9 plug = = D ue maière géérale lorsque B ted vers l ifii la valeur σ^ θ^ * ted vers ue valeur fixée qui correspod à l estimatio de l erreur-stadard du bootstrap idéal Efro et Tibshirai (993) proposet les règles empiriques suivates pour le choix de B : u ombre réduit de répétitios (B = 5 par exemple) permet d obteir ue première iformatio et B = 50 est gééralemet suffisat pour avoir ue boe estimatio de l erreur-stadard ; il est très rare que plus de 00 répétitios soiet écessaires pour estimer ue erreur-stadard O peut oter que le choix de B est pas foctio de la taille de l échatillo 3 Estimatio du biais ˆ σ plug σ = ( x m ) i= ( x x) i= i Le biais d u paramètre peut être estimé par la méthode du bootstrap de la maière suivate : i X biaisb ( ) = plug θ^plug état l estimatio par plug-i du paramètre θ même si θ^ est pas ue estimatio par plug-i Aisi pour la moyee et pour la médiae θ^ est égale à θ^plug et l estimatio du biais pour ces deux paramètres est égale à : 799 83 = 04 et 044 56 = Pour la variace l estimatio par isertio est égale à 84608 et l estimatio du biais est égale à : 84358 84608 = 50 Disposat d ue estimatio du biais o peut évetuellemet corriger l estimatio iitiale O obtiet alors : ( C = biais B ) O otera cepedat que la correctio systématique du biais par la relatio ci-dessus peut s avérer dagereuse das la mesure où cette correctio peut augmeter l erreur-stadard de maière importate E pratique lorsque le rapport du biais à l erreur-stadard est iférieur à 05 il est souvet préférable de e pas corriger l estimateur pour le biais D autre part u rapport supérieur à 05 peut être ue idicatio que la statistique θ^ = f ( x x ) e s t iappropriée pour estimer θ Pour l exemple ci-dessus il y a certaiemet pas itérêt à corriger les estimatios pour le biais puisqu o peut motrer que les trois estimatios sot o biaisées (Dagelie 998) Lorsque θ^ est ue estimatio par isertio o a démotré qu ue meilleure estimatio du biais est obteue e teat compte des proportios d apparitio P i * défiies au paragraphe Il suffit de remplacer das la formule ci-dessus θ^plug par θ^ plug θ^ plug état ue foctio des observatios de l échatillo x qui attribue aux observatios x i u poids égal à P i * au lieu de leur attribuer des poids égaux à P 0 = / 33 Estimatios par jackkife Ue autre forme de rééchatilloage permettat d estimer l erreur-stadard et le biais d u paramètre est la techique du jackkife O calcule fois la valeur du paramètre à partir d u échatillo de - observatios chacue des observatios état élimiée à so tour de l échatillo E désigat par θ^(-i) l estimatio obteue après élimiatio de l observatio i o peut estimer l erreur-stadard du paramètre θ^ par la relatio suivate (Efro Tibshirai 993 ; Dagelie 998) :

48 Biotechol Agro Soc Eviro 00 6 (3) 43 53 R Palm avec : et le biais vaut : σˆ θ ˆ = J i= biaisj J ( ( i) J ) = θ ˆ i= ( i) ( ) = ( )( ) Lorsque la taille de l échatillo est iférieure au ombre de répétitios utilisé das la méthode du b o o t s t r a p soit le plus souvet etre 50 et 00 le calcul de l erreur-stadard et du biais est plus rapide par le jackkife Par cotre la méthode du jackkife qui peut être cosidérée comme ue approximatio du b o o t s t r a p doe de maière géérale de mois boes estimatios De plus la méthode du jackkife peut doer des résultats aberrats lorsque la statistique θ^ est pas ue foctio cotiue (smooth fuctio) des observatios x i c est-à-dire ue foctio variat de maière régulière lorsque les doées chaget La médiae est u cas typique de foctio o cotiue Pour l exemple des exploitatios agricoles la méthode du j a c k k i f e doe les erreurs-stadards suivates : 9 pour la moyee 56 pour la médiae 969 pour la variace Pour la moyee et pour la variace les erreursstadards sot proches des valeurs obteues par bootstrap respectivemet égales à 89 et 845 (Tableau ) Par cotre pour la médiae l erreurstadard obteue par jackkife est plus de deux fois plus grade que celle obteue par bootstrap Cette valeur est cepedat aberrate comme sigalé cidessus car elle est e fait foctio que de la d i fférece qui existe etre deux observatios successives particulières Cosidéros e effet la série statistique costituée des six observatios suivates ordoées par ordre croissat : 89 ; 946 ; 00 ; 3 ; 6 et 65 E élimiat tour à tour ue observatio la médiae x ~ (-i) vaut soit 3 si l observatio élimiée est ue des trois premières soit 00 si l observatio élimiée est ue des trois derières La somme des carrés des écarts de toutes ces médiaes est doc foctio que de l écart qui existe etre l observatio de rag / et celle de rag / + La série statistique cosidérée ici est e réalité la partie cetrale de l échatillo x de 00 observatios classées par ordre croissat Plus précisémet il s agit des observatios de rag 48 à 53 E appliquat la méthode du jackkife à cet échatillo complet o obtiet 50 médiaes J égales à 00 et 50 médiaes égales à 3 L erreurstadard de la médiae s écrit doc : ( 99)( 00) [( 3 00) ] 5 6 σˆ ˆ = = θ J 00 et e déped que de l écart etre l observatio de rag 50 et celle de rag 5 4 INTERVALLE DE CONFIANCE 4 Méthode de l erreur-stadard Ue première solutio cosiste à défiir l itervalle de cofiace par la méthode de l erreur- s t a d a r d (stadard bootstrap cofidece iterval) : θ ˆ ± u σ α / ˆ * u -α/ état le pourcetile α/ de la distributio ormale réduite et α état le degré de cofiace reteu Pour que cette approche soit satisfaisate il faut que la distributio d échatilloage du paramètre étudié soit approximativemet ormale que l estimateur soit o biaisé et que σ^θ^* soit ue boe estimatio de l erreur-stadard de la distributio du paramètre Le fait que ces coditios soiet remplies ou o déped des circostaces La coditio de ormalité peut être vérifiée à partir de la distributio des θ^k * et il peut être utile évetuellemet d effectuer ue trasformatio de maière à redre la distributio plus proche de la ormale Le biais de l estimateur peut être estimé comme ous l avos vu au paragraphe 3 mais sa prise e compte risque d augmeter la variace de l estimateur Efi la qualité de l estimatio de l erreur-stadard est liée au ombre de répétitios B cosidéré et ous avos sigalé au paragraphe 3 que 50 répétitios sot gééralemet suffisates Pour l exemple cosidéré et pour u degré de cofiace de 95 % o obtiet les limites de cofiace suivates respectivemet pour la moyee pour la médiae et pour la variace : 83 ± (96)(89) soit 47 et 3379 56 ± (96)(53) soit 660 et 65 et 85463 ± (96)(845) soit 49350 et 576 Le caractère tout à fait o ormal de la distributio des médiaes ous coduit cepedat à mettre e doute a priori le résultat obteu pour ce paramètre 4 Méthode des pourcetiles simples Das la méthode des pourcetiles simples (simple p e rcetile cofidece iterv a l) les limites de cofiace

Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres 49 sot doées par les pourcetiles α/ et α/ de la distributio d échatilloage empirique c est-à-dire de la distributio des θ^k * Nous les otos θ^* [α/] et θ^* [ α/] Cotrairemet à la méthode de l erreur-stadard la distributio d échatilloage du paramètre étudié e doit pas être ormale pour que la méthode des pourcetiles soit satisfaisate Par cotre le ombre de rééchatilloages B doit être plus élevé que das le cas de la méthode de l erreur-stadard car il faut u plus grad ombre d observatios pour estimer avec ue précisio suffisate u pourcetile que pour estimer u écart-type B sera par exemple de l ordre de 000 Pour 000 rééchatilloages et pour u degré de cofiace de 95 % les pourcetiles 005 et 0975 correspodet approximativemet à l observatio de rag 5 et à l observatio de rag 975 la valeur exacte pouvat dépedre de l algorithme utilisé pour le calcul de ces pourcetiles Les résultats obteus pour les trois paramètres cosidérés das l exemple sot les suivats : 48 et 3389 pour la moyee 48 et 40 pour la médiae et 59 et 4880 pour la variace Il faut oter aussi qu ue procédure de calcul u peu différete a été proposée par Hall (99) et est décrite par Maly (997) La méthode cosiste à calculer les écarts : ê* k = k et à détermier les pourcetiles α/ et α/ otés e^* [α/] et e^* [-α/] de cette distributio Les limites de cofiace sot alors doées par les relatios : ê* * [ /] [-α/] et ê α Par cette méthode o obtiet das le cas de l exemple 37 et 3378 pour la moyee 9 et 83 pour la médiae et 46046 et 9634 pour la variace 43 Méthode des pourcetiles corrigés pour le biais O détermie d abord la proportio p de valeurs θ^k * iférieures à θ^ et o calcule le pourcetile u p relatif à la distributio ormale réduite Soit α et α les valeurs de la foctio de répartitio de la ormale réduite aux poits u et u : α = Φ( u ) et α = Φ( u) avec u = u p + u α/ et u = u p + u α/ Les limites de cofiace détermiées par la méthode des pourcetiles corrigés pour le biais (bias corrected percetile cofidece iterval) sot alors les pourcetiles θ^* [α ] et θ^* [α ] de la distributio des θ^k * Des iformatios cocerat l origie de cette correctio sot doées das Efro et Ti b s h i r a i (993) et das Cherick (999) O remarque que si p = 05 c est-à-dire si θ^ est la médiae de la distributio des θ^k * il y a pas de correctio pour le biais puisque u p = 0 et o retrouve la méthode précédete Si p est iférieur à 05 les limites de cofiace correspodet à des pourcetiles iférieurs respectivemet à α/ et α/ Au cotraire si p est supérieur à 05 les limites correspodet à des pourcetiles supérieurs à α/ et α/ Par exemple si p = 04 les limites de cofiace pour u degré de cofiace de 095 sot les pourcetiles θ^* θ^* [00068] et θ^* [0969] Pour p = 06 les limites correspodet à [0073] et θ^* [0993] Pour les exploitatios agricoles les valeurs de p sot égales à 054 0533 et 0555 respectivemet pour la moyee pour la médiae et pour la variace Les limites de cofiace serot par coséquet toutes légèremet plus grades que das le cas de la méthode des pourcetiles simples O obtiet e effet 303 et 346 pour la moyee578 et 47 pour la médiae et 5545 et 303 pour la variace 44 Méthode des pourcetiles avec correctio pour le biais et accélératio La méthode précédete qui pred e compte le biais peut être étedue de maière à teir compte d u évetuel chagemet de l erreur-stadard de θ^ lorsque θ varie Elle porte alors le om de méthode des pourcetiles avec correctio pour le biais et accélératio (bias corrected ad accelerated cofidece iterv a l) Ue justificatio de cette méthode est doée par Efro et Tibshirai (993) θ^* Les limites de cofiace sot les pourcetiles [α ] et θ^* [α ] de la distributio des θ^k * α et α état les valeurs de la foctio de répartitio de la variable ormale réduite aux poits u et u défiis de la maière suivate : u = u p + ( u p + uα / ) [ a( u p + uα / )] u = u p + ( u p + u α / ) [ a( u p + u α / )] Das ces relatios u p est défii comme précédemmet et la costate a est appelée accélératio car elle est liée au taux de variatio de l erreur-stadard de θ^ lorsque le paramètre θ varie Cette costate peut être estimée de diff é r e t e s maières Ue solutio cosiste à utiliser la techique du jackkife O obtiet alors le paramètre a par la relatio suivate : 3 ( ˆ ˆ θ θ ) 6 ( ˆ ) a = J ( i) J θ( i) i= i= 3 /

50 Biotechol Agro Soc Eviro 00 6 (3) 43 53 R Palm Das cette relatio θ^( - i ) est l estimatio du paramètre θ obteue à partir de l échatillo iitial dot o a elevé la i ème observatio et θ^j est la moyee des valeurs θ^(-i) O peut costater que si a = 0 o retrouve la méthode des pourcetiles corrigés pour le biais La prise e compte de l accélératio costitue doc bie ue extesio de la méthode précédete Les limites obteues par cette méthode sot pour l exemple examié 3 et 3533 pour la moyee 578 et 47 pour la médiae et 58975 et 40585 pour la variace O costate que pour la médiae les résultats sot idetiques à ceux obteus par la méthode précédete le paramètre a état ul du fait de la parfaite symétrie de la distributio des x ~ (-i) comme ous l avos précisé au paragraphe 33 45 Méthode du bootstrap-t L idée mise e applicatio das le bootstrap-t est de défiir ue statistique dot la distributio e soit pas foctio de la valeur réelle et icoue du paramètre θ La statistique T : θ θ Τ = ˆ σ θ peut remplir ce rôle Il s agit alors d approcher la distributio théorique de T par rééchatilloage Das ce but o calcule : = k tk σˆ ( k ) σ^ (θ^k * ) état l erreur-stadard de θ^k * qui déped doc de l échatillo k Elle peut être calculée par ue formule théorique lorsqu ue telle formule est dispoible ou à partir du rééchatilloage de l échatillo x k * utilisé pour calculer θ^k * Il s agit alors d u b o o t s t r a p à deux iveaux puisque chaque échatillo x k * fait lui-même l objet d u rééchatilloage permettat de calculer l erreurstadard selo la méthode décrite au paragraphe 3 Ue autre possibilité pour estimer l erreur-stadard est le recours à la méthode du jackkife (paragraphe 33) Pour l échatillo x k * θ^* o détermie les valeurs (- i ) e élimiat à tour de rôle chacue des observatios et o calcule l erreur-stadard du paramètre par la relatio suivate : σˆ ( ) ( ) i i i= i= ( ˆ* ) = ˆ θ θ k Lorsque l effectif de l échatillo est iférieur au ombre de répétitios au secod iveau oté B la méthode du jackkife exige mois de calculs mais l estimatio est gééralemet mois boe que l estimatio par bootstrap du mois lorsque B est suffisammet grad (de 50 à 00 par exemple) comme sigalé au paragraphe 33 Disposat de la distributio des t* k o e détermie les pourcetiles α/ et α/ otés t* [α/] et t* [-α/] et o obtiet les limites de cofiace du paramètre θ par les relatios : θ ˆ = t* α σ = [- /] ˆ et t * [ α σˆ /] Le bootstrap à deux iveaux a été appliqué à l échatillo des 00 tailles d exploitatios agricoles le ombre de répétitios au deuxième iveau état égal à 50 Pour la moyee les pourcetiles 005 et 0975 de la distributio observée des t * k sot les suivats : t * 3364 et * [ 005] = t [0 7574 975] = Les limites de cofiace de la moyee sot par coséquet égales à : 83 (7574)(89) = 305 et 83 ( 3364)(89) = 3488 Des calculs idetiques ot été réalisés pour la médiae et pour la variace ; les limites de cofiace obteues sot respectivemet 845 et 766 pour la médiae et 569 et 534 pour la variace 46 Choix d ue méthode Das les paragraphes précédets diverses méthodes de calcul de l itervalle de cofiace ot été décrites Le tableau 3 repred quelques caractéristiques de ces méthodes La méthode du pourcetile avec correctio Tableau 3 Caractéristiques des méthodes de calcul de l itervalle de cofiace d u paramètre ( : méthode de l erreur-stadard ; : méthode des pourcetiles simples ; 3 : méthode des pourcetiles corrigés pour le biais et a c c é l é r a t i o ; 4 : méthode du b o o t s t r a p - t) C h a r a c t e r i s t i c s of the methods for computig cofidece iterval of a parameter (: stadard bootstrap; : simple percetile; 3: bias corrected ad accelerated; 4: bootstrap-t cofidece iterval) Méthodes 3 4 Nombre de rééchatilloages 00 000 000 000 00 Ifluece d ue trasformatio oui o o oui Respect du domaie o oui oui o Ordre de précisio / /

Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres 5 du biais a pas été reprise car il s agit d u cas particulier de la méthode avec correctio du biais et accélératio La première lige du tableau cocere l ordre de gradeur du ombre d échatillos qu il faut prélever pour le calcul des limites de cofiace La méthode de l e r r e u r-stadard est la plus rapide (B = 00 par exemple) alors que la méthode du bootstrap-t est la plus coûteuse puisqu elle fait appel au bootstrap à deux iveaux : par exemple B = 000 répétitios au premier iveau chacue de celles-ci faisat l objet de B = 00 répétitios pour l estimatio de l erreurstadard sauf si est plus petit que 00 et qu o utilise la méthode du jackkife qui est cepedat e gééral mois boe La deuxième lige du tableau cocere l ifluece d ue trasformatio comme par exemple la trasformatio argumet tagete hyperbolique das le cas du coefficiet de corrélatio La méthode de l erreur-stadard et la méthode du bootstrap-t sot ifluecées par ue trasformatio alors que les méthodes basées sur les pourcetiles e le sot pas Aucue trasformatio e doit doc être recherchée pour les derières méthodes citées La troisième lige du tableau sigale si l itervalle de cofiace respecte le domaie das lequel doit se trouver le paramètre θ Aisi par exemple les méthodes qui e respectet pas le domaie (méthode de l erreur-stadard et méthode du b o o t s t r a p - t) peuvet coduire à des limites de cofiace qui e sot pas das le domaie ( ) pour u coefficiet de corrélatio alors que les autres méthodes e doerot jamais des limites de cofiace situées e dehors de ce domaie Efi la quatrième lige a trait à la proportio d itervalles de cofiace corrects Idéalemet pour u degré de cofiace égal à 095 par exemple la probabilité que la limite iférieure de l itervalle de cofiace soit supérieure à θ doit être égale à 005 De même la probabilité que la limite supérieure de l itervalle soit iférieure à θ doit être égale à 005 Plutôt que de cosidérer les deux limites simultaémet o peut s itéresser à ue seule limite Soit θ [α] la limite calculée telle que idéalemet : O peut motrer que les méthodes de l erreurstadard et des pourcetiles simples coduiset à des probabilités e gééral égales à : P P ( θ θ α ) = α ( θ < θ ) α Ο( - / α = + ) [ < [ ] ] tadis que les méthodes du b o o t s t r a p - t et des pourcetiles avec correctio du biais et accélératio sot du type : Les termes Ο ( / ) et Ο ( ) idiquet respectivemet l ordre de gradeur de l erreur Ces relatios motret que les deux derières méthodes citées sot préférables de ce poit de vue La comparaiso des différetes méthodes proposées motre que la méthode des pourcetiles corrigés pour le biais et accélératio offre das l esemble le plus d avatages et est de ce fait précoisée par Efro et Tibshirai [993] 47 Comparaiso des résultats pour l exemple Les limites de cofiace obteues par les différetes méthodes ot été doées das les paragraphes précédets (paragraphes 4 à 45) À titre de comparaiso les itervalles de cofiace ot égalemet été calculés e utilisat des méthodes paramétriques classiques même si a priori o sait que les coditios d applicatio e sot pas remplies Aisi pour la moyee o a : Pour la médiae et pour ue populatio-paret ormale o a : Efi pour la variace o a reteu la méthode basée sur l utilisatio de la distributio χ à degrés de liberté valable pour ue populatio ormale et la méthode de l erreur-stadard : avec P ( θ < θ α ) = α + Ο( - ) ~ x ± u α / π σ σˆ ± u α / V σ ˆ [ βˆ + 3] ˆ 4 ( ) ( σˆ ) ( ) [ ] x ± t α / σˆ ( ) V = σ qui suppose que la distributio d échatilloage de la variace est proche de la distributio ormale Le tableau 4 repred les limites de cofiace pour les trois paramètres evisagés O e ote pas de différeces importates etre les méthodes pour la moyee Par cotre les différeces sot plus importates pour la médiae E particulier l itervalle obteu par la méthode classique est sesiblemet plus large que celui obteu par les méthodes basées sur le rééchatilloage Pour la variace les résultats sot égalemet assez différets selo la méthode utilisée : la méthode classique basée sur l utilisatio de la distributio χ présete u itervalle ettemet plus étroit et la méthode des

5 Biotechol Agro Soc Eviro 00 6 (3) 43 53 R Palm Tableau 4 Itervalles de cofiace de la moyee de la médiae et de la variace : résultats pour les différetes méthodes Cofidece itervals of the mea the media ad the variace: results for the various methods Méthodes Moyee Médiae Variace Bootstrap Erreur-stadard 47 660 494 3379 65 6 Pourcetiles simples 48 48 53 3389 40 49 Correctio/biais 303 578 554 346 47 303 Correctio/ 3 578 590 biais et accélératio 3533 47 406 Bootstrap-t 305 845 56 3488 766 53 Méthodes classiques Erreur-stadard 33 439 465 3393 874 44 Distributio χ - - 659 53 pourcetiles avec correctio du biais et accélératio et surtout le bootstrap-t coduiset à u itervalle plus large que les autres méthodes Pour mieux apprécier la qualité des différetes méthodes comparées Sodjiou (00) a répété les calculs pour 000 échatillos aléatoires et simples prélevés das la populatio-paret et a détermié la proportio d itervalles de cofiace e coteat pas la valeur réelle du paramètre Les résultats obteus sot repris das le tableau 5 Les itervalles état calculés pour u iveau de cofiace théorique de 095 la proportio d itervalles e coteat pas le paramètre réel devrait idéalemet être de α = 005 Pour la moyee o ote ue boe cocordace etre les différetes méthodes la proportio d itervalles e coteat pas la moyee état Tableau 5 Pourcetages d itervalles de cofiace e coteat pas le paramètre de la populatio : résultats pour les différetes méthodes P e rcetages of cofidece i t e rvals that do ot iclude the parameter of the populatio: results for various methods Méthodes Moyee Médiae Variace Bootstrap Erreur-stadard 63 56 9 Pourcetiles simples 6 5 7 Correctio/biais 60 5 99 Correctio/biais et accél 67 5 58 Bootstrap-t 5 6 98 Méthodes classiques Erreur-stadard 58 45 0 Distributio χ - - 445 légèremet trop grade pour l esemble des méthodes Pour la médiae o ote égalemet ue boe cocordace etre les résultats La méthode classique de l erreur-stadard coduit à des résultats comparables à ceux obteus par bootstrap bie que la formule d estimatio de la variace de la médiae qui a été utilisée e soit valable que pour des populatios ormales Sigalos cepedat que la méthode de l erreur-stadard est pas la seule méthode paramétrique dispoible Aisi Miitab (000) propose ue solutio basée sur l utilisatio de la distributio biomiale de paramètre p = 05 Das le cas de la variace o costate l iadéquatio de la méthode basée sur la variable χ pour laquelle 45 % des itervalles e cotieet pas la variace de la populatio La méthode est doc très mauvaise das le cas d ue o-ormalité accetuée de la populatio-paret La méthode classique de l erreur-stadard est u peu mois mauvaise et doe des résultats comparables aux méthodes basées sur le rééchatilloage à l exceptio du bootstrap-t qui pour cet exemple est sesiblemet supérieur aux autres bie que la proportio d itervalles e coteat pas la moyee soit le double de la valeur attedue 5 CONCLUSIONS Le bootstrap est ue méthode d iférece statistique basée sur l utilisatio de l ordiateur qui peut répodre sas formules à beaucoup de questios statistiques réelles C est e ces termes qu Efro et Tibshirai (993) présetet le b o o t s t r a p das la préface de leur ouvrage Il est icotestable que l utilisatio des techiques de rééchatilloage a été redue possible grâce à la gééralisatio des moyes de calculs performats Ces techiques reposet au départ sur des idées simples Toutefois il faut bie admettre que les développemets apportés aux méthodes de base leur ot fait perdre ue partie de cette simplicité Das cette ote ous ous sommes limité au problème de l estimatio du biais et de l erreur-stadard d u paramètre et à la détermiatio des limites de cofiace d u paramètre Il e s agit cepedat pas là des seules applicatios des méthodes de rééchatilloage Celles-ci peuvet e effet aussi être utilisées pour la réalisatio de différets tests d hypothèses pour le choix des variables et l estimatio de l erreur de prédictio e régressio pour l estimatio du taux d erreur e aalyse discrimiate otammet Bie qu elles puisset être utilisées das des situatios très variées leur mise e œuvre e présete guère d itérêt lorsque l iférece statistique peut être réalisée par des méthodes aalytiques classiques pour lesquelles les coditios d applicatio sot remplies Elles e sot doc pas destiées à remplacer les

Utilisatio du bootstrap pour les problèmes statistiques liés à l estimatio des paramètres 53 méthodes d iférece statistique classiques lorsque celles-ci sot applicables mais plutôt à fourir des réposes à des questios pour lesquelles les méthodes classiques sot iapplicables ou o dispoibles Aisi pour l exemple traité le recours au bootstrap e se justifie certaiemet pas das le cas de la moyee et de la médiae Pour la moyee o peut e effet utiliser la méthode de l erreur-stadard compte teu du caractère approximativemet ormal de la distributio d échatilloage de la moyee vu la taille de l échatillo Pour la médiae o dispose d ue approche o paramétrique (Miitab 000) Par cotre pour la variace l utilisatio du bootstrap costitue ue alterative valable Le caractère relativemet gééral des problèmes qui peuvet être résolus par bootstrap e doit pas faire perdre de vue que la qualité de l iférece déped de la ature de la questio posée et de la dispoibilité des doées Comme le suggère Maly (997) le b o o t s t r a p doit être utilisé avec prudece das les situatios où il a pas ecore été testé de maière approfodie Ue discussio assez géérale sur l itérêt et les limites du bootstrap est doée das la sythèse proposée par Youg (994) et das les commetaires suscités par l article e questio Efi l absece das les logiciels classiques de foctios permettat d utiliser le b o o t s t r a p sas obligatio pour l utilisateur de programmer lui-même les procédures de calcul est certaiemet u frei à l utilisatio du bootstrap das les cas où il pourrait être utilisé Bibliographie Cherick MR (999) Bootstrap methods: a practitioer's guide New York: Wiley 64 p D a g e l i e P (998) Statistique théorique et appliquée Tome : statistique descriptive et bases de l iférece statistique Bruxelles : De Boeck et Larcier 508 p Efro B Tibshirai RJ (993) A itroductio to the bootstrap New York: Chapma ad Hall 436 p Hall P (99) The bootstrap ad Edgeworth expasio New York: Spriger 35 p INS (996) Recesemet agricole et horticole au 5 mai 9 9 5 Statistiques A g r i c o l e s Bruxelles : Istitut Natioal de Statistique p 96 L é g e r C Politis DHN Romao J P (99) Bootstrap techology ad applicatios Te c h o m e t r i c s 3 4 p 378 398 Maly BFJ (997) Radomizatio bootstrap ad Mote Carlo methods i biology New York: Chapma ad Hall 399 p Miitab (000) Miitab user's guide : data aalysis ad quality tools Release 3 for Widows Miitab Sodjiou (00) Techiques de rééchatilloage avec le logiciel statistique S-Plus 000 : applicatio à la régressiotravail de fi d études Fac uiv Sci agro Gembloux 3 p Youg GA (994) Bootstrap: more tha a stab i the dark? Stat Sci 9 p 38 45 (0 réf)