Bootstrap et procédures de rééchantillonnage

Dimension: px
Commencer à balayer dès la page:

Download "Bootstrap et procédures de rééchantillonnage"

Transcription

1 Bootstrap et procédures de rééchantillonnage Alain MORINEAU L'analyse des données au XXI ème siècle Alain Morineau 1

2 Notions utiles (en bref) Population, échantillon, variabilité Estimation, distribution d échantillonnage Intervalle de confiance, test d hypothèse Seuil alpha, p-value Intervalle de confiance pour la moyenne Intervalle de confiance pour une régression: Monte Carlo pour la pente Alain Morineau 2

3 Echantillon Une population (ou population-mère) Un échantillon (au hasard) Une certaine variabilité apparaît de façon naturelle quand on effectue plusieurs observations (échantillon) L'échantillon sert à mieux connaître la population (par inférence) Pas de statistique (pas d'inférence) sans un échantillon Pas d'inférence sans risques d erreurs Car on passe d observations particulières à une conjecture plus générale sur ce qu on n a pas observé Ex: il y a une majorité de brun dans l échantillon, donc une majorité de brun dans la population Alain Morineau 3

4 Principe de l inférence statistique 1 Population totale des observations possibles 2 Echantillon aléatoire de taille n 4 Cette valeur est une estimation pour la population 3 Calcul de la statistique dans l échantillon Alain Morineau 4

5 Inférence statistique : deux approches Estimation Estimer un paramètre permettant de préciser la loi de la variable étudiée La réponse est numérique Combien vaut la moyenne de la population (loi)? Quelle est la précision de l'estimation du paramètre? Test Valider ou non une hypothèse portant sur un paramètre, sur une loi de probabilité ou sur une liaison entre variables La réponse est en oui/non Oui, l hypothèse peut être rejetée Non, elle ne peut pas Alain Morineau 5

6 Théorème de la limite centrale La moyenne de n variables aléatoires ayant la même distribution (moyenne m et variance s 2 ) tend, quand n augmente, vers une loi normale de moyenne m et de variance s 2 /n Un des plus importants théorèmes de la statistique De Moivre-Laplace (XVIII ème ) pour la distribution binomiale Lindeberg-Lévy (1922) sous cette forme Généralisations nombreuses depuis (très mathématique) Utilisation constante pour approcher les lois inconnues de paramètres utilisés par les statisticiens Les méthodes de rééchantillonnage tentent d'approcher la distribution des statistiques sans recours au théorème de la limite centrale, mais en s'appuyant seulement sur les données Alain Morineau 6

7 Estimation Estimation ponctuelle Estimation par intervalle de confiance Exemples Moyennes : test de Student Estimer la moyenne dans une population à partir de la moyenne dans un échantillon Proportions : test du Khi-2 Estimer la proportion dans une population à partir de la proportion dans un échantillon Alain Morineau 7

8 Moyenne et écart-type Exemple de valeur centrale : la moyenne Exemple de dispersion : l'écart-type empirique (en n) s n i 1 2 x x i n Alain Morineau 8

9 Interprétation d'un intervalle de confiance échantillon x = 50 Echantillon La moyenne vaut 50 Je suis sûr à 95% que m est compris entre 40 et 60 Population La moyenne m est inconnue Si je faisais 1000 échantillons ou plus, dans 95% des cas l intervalle contiendrait m (qui reste inconnu) Alain Morineau 9

10 Notion d intervalle de confiance Graphique des 100 premiers intervalles à 95% Après tirages : couverture 93,6% Alain Morineau 10

11 Tests: deux types d hypothèses Les hypothèses à tester Hypothèse nulle, hypothèse alternative H 0 identité de 2 distributions H 0 nullité d'un coefficient de corrélation, etc. Les hypothèses de commodité Pour rendre les calculs simples, possibles Hypothèses techniques admises comme vraies loi normale variances égales observations indépendantes, etc. Alain Morineau 11

12 p-value et seuil a test unilatéral) Distribution de la statistique sous H0 Rejet de H 0 Non rejet de H 0 a 0,0 Alain Morineau 12

13 Que signifie une différence entre moyennes? variabilité moyenne variabilité forte La différence numérique est la même dans les 3 cas variabilité faible Quel cas montre la différence la plus grande? Alain Morineau 13

14 Comment évaluer une différence? Une différence statistique est fonction de la différence entre les moyennes évaluée en fonction de la variabilité Une petite différence entre moyennes avec une grande variabilité peut être dûe au hasard Si on accepte les hypothèses de commodité, la différence entre moyennes suit approximativement une loi de Student t x1 x2 s( x x ) 1 2 On s'appuie sur cette loi approchée pour construire un intervalle de confiance ou tester l'égalité des moyennes (nullité de la différence) Alain Morineau 14

15 Seuil a On parle en terme de fréquence : la fréquence tend vers la probabilité Pour un intervalle de confiance autour d'une estimation Seuil 95% : si on répétait un grand nombre de fois la collecte d'un échantillon, 95% des intervalles contiendraient la vraie valeur (inconnue) du paramètre à estimer Pour un test d'hypothèse Seuil 95% (ou seuil 0,05) : si on répétait la procédure de test un grand nombre de fois, on rejetterait à tort l'hypothèse nulle dans 5% des cas Mais en général on a un seul échantillon Equivalence intervalle et test au même seuil alpha Rejeter l'hypothèse nulle du paramètre égal à 0 si et seulement si l'intervalle ne contient pas le 0 Alain Morineau 15

16 La convention de seuil a La valeur du seuil a (intervalle ou test) est pure convention a = 0,05 ou a = 0,01 ou a = 0,001 Mais le seuil doit être décidé avant la procédure statistique Si tous les statisticiens du monde adoptaient en permanence le même seuil a... les décisions de rejet des hypothèses nulles seraient erronées avec la probabilité a Alain Morineau 16

17 Bootstrap Alain Morineau 17

18 Quelques dates clés du rééchantillonnage 1949, 1956 M. H. Quenouille propose une technique pour estimer le biais (précurseur du «Jackknife») 1958 John Tukey appelle Jackknife cette technique et l'utilise pour calculer un écart-type 1979 Bradley Efron rédige de nombreuses publications sur le "Boostrap" Alain Morineau 18

19 Présentation du Bootstrap Méthode introduite par Bradley Efron (1979) pour estimer la variance des distributions d'échantillonnage pour construire des intervalles de confiance pour réaliser des tests d'hypothèses Particularités du Bootstrap Laureate of the 2005 National Medal of Science application du calcul intensif aux méthodes traditionnelles de l'inférence statistique s'applique quelle que soit la complexité de l'estimateur sans nécessiter de considérations théoriques (probabilistes) Alain Morineau 19

20 Bootstrap? drôle de nom «The use of the term bootstrap derives from the phrase to pull oneself up by one s bootstrap» (Efron & Tibshirani, 1993, p. 5). «to pull oneself up by one s bootstrap» L'origine de cette expression semble être le livre Singular Travels, Campaigns and Adventures of Baron Munchausen de Rudolph Erich Raspe (1786). Le baron, tombé au fond d'un lac profond, réussit à s'extraire en tirant sur les "straps" (attaches?) de ses bottes Alain Morineau 20

21 Le contexte de l'époque Développement des méthodes statistiques entre 1850 et 1950, époque où le calcul est lent et coûteux Elles s'appuyent sur des mesures statistiques dont les distributions sont facilement calculables par des solutions mathématiques (probabilistes) Rééchantillonnage: méthodes nouvelles, sans analyse mathématique, mettant à profit le calcul sur ordinateur Le Bootstrap, introduit par B. Efron en 1979 "The most important new idea in statistics in the last 20 years, and probably the last 50. Eventually, it will take over the field, I think." Jérome H. Friedman, statisticien à Stanford Alain Morineau 21

22 À méditer In a world in which the price of calculation continues to decrease rapidly, but the price of theorem proving continues to hold steady or increase, elementary economics indicates that we ought to spend a larger and larger fraction of our time on calculation. J. W. Tukey John W. Tukey Alain Morineau 22

23 Le contexte Bootstrap Etudier la variabilité empirique à partir des données Recourir à des formules et à des distributions théoriques Le Bootstrap est utilisé principalement Faire des hypothèses incontrôlables sur la variabilité Utiliser les données et rien que les données pour analyser la variabilité de paramètres statistiques pour produire des intervalles de confiance de ces paramètres L intervalle de confiance construit par Bootstrap est généralement de même amplitude que celui de la distribution réelle quand on la connaît Alain Morineau 23

24 Position du problème On possède un échantillon issu d une population caractérisée par un certain paramètre. On a choisi un estimateur de ce paramètre (c'est une certaine fonction des observations). Exemples: la corrélation empirique pour estimer une corrélation le quotient empirique pour estimer un quotient les paramètres de la droite des moindres carrés pour estimer une liaison linéaire, etc. Le Bootstrap est une méthode qui peut : Essentiellement: fournir une estimation sans biais du paramètre évaluer la précision de cette estimation construire un intervalle de confiance autour de cette estimation Mais aussi: tester une hypothèse "nulle" (calcul d'une p-value) Alain Morineau 24

25 Principe du rééchantillonnage Bootstrap On crée des échantillons «artificiels» à partir de l échantillon réel : appelés "répliques Bootstrap" ou "répliques" On calcule la statistique sur chacun des échantillons artificiels On construit la loi de distribution empirique de la statistique On l'appelle "distribution Bootstrap" On réalise toute inférence statistique à partir de cette loi: Biais, écart-type, quantiles, intervalles de confiance La variabilité réelle de la statistique dans la population est évaluée par la variabilité observée sur l ensemble des échantillons artificiels obtenus par rééchantillonnage Alain Morineau 25

26 Procédure Bootstrap Obtenir un échantillon des observations et choisir la statistique pertinente pour le problème Utiliser cet échantillon comme si c'était la population-mère: en extraire des échantillons de même taille par tirage avec remise (rééchantillonnage): réplique 1 réplique 2 réplique k Pour chaque réplique, calculer la statistique Utiliser la "distribution Bootstrap" de la statistique pour estimer les propriétés de l'échantillon (donc de la population-mère) Remarque: il s'agit du Bootstrap dit "non paramétrique" (le plus pratiqué) pour le distinguer des variantes : "paramétrique" ou "semi-paramétrique". Alain Morineau 26

27 Répliques Bootstrap et statistique estimée Echantillon observé (n = 5) On s'intéresse à sa moyenne {23, 28, 30, 50, 61} x = 38,4 Répliques Bootstrap k {28, 50, 30, 23, 23} {30, 50, 50, 61, 28} {61, 23, 30, 23, 28}.. {28, 50, 30, 61, 30} x = 30,8 x = 43,8 x = 33,0 x = 39,8 Alain Morineau 27

28 "Bootstraper" Tout échantillon est tiré d une population ou "population-mère" (essentiellement mal connue) dont on ne voit qu un extrait L échantillon peut lui-même jouer le rôle de population: on en tire un nouvel échantillon; c est le rééchantillonnage Dans le cas du bootstrap, il s effectue avec remise, de manière à avoir toujours la même taille des données Selon la taille n de l'échantillon, on peut créer : 10 répliques différentes pour un jeu de 3 individus, 35 répliques différentes pour 4 individus répliques pour répliques pour 11; etc. "Bootstraper" c'est tirer au hasard parmi toutes les répliques possibles (sans construire tous les possibles!) Alain Morineau 28

29 Changement de point-de-vue De quoi parle souvent le statisticien? des distributions plutôt que des données mais ce sont les données que l'on connait Le Bootstrap cherche à connaître les distributions en n'utilisant que les données sans hypothèses de travail sans recours au théorème de la limite centrale Le Bootstrap n'est pas une méthode pour réduire l'incertitude c'est une méthode pour l'estimer Attention : le Booststrap n'est pas un remède pour pallier aux "mauvais" échantillons Alain Morineau 29

30 Rôle de l'échantillon Les rôles Population/Echantillon sont échangés : population-mère <=> échantillon valeur vraie <=> estimation sur l'échantillon échantillon <=> réplique Bootstrap distribution de la statistique <=> distribution Bootstrap Le bootstrap fournit une distribution de valeurs et pas seulement une valeur de la statistique l intérêt n est pas d avoir une nouvelle estimation (en effet elle n est pas plus fiable) mais on peut calculer un écart-type et/ou un intervalle de confiance pour cette nouvelle estimation (moyenne des estimations sur les répliques) ou toute autre propriété utile de la distribution Alain Morineau 30

31 Rééchantillonnage et distribution Bootstrap Une distribution d'échantillonnage est construite sur l'infinité des échantillons tirés de la population On dispose d'un seul échantillon Faute d'échantillons nombreux, on crée des rééchantillons (ou répliques) en tirant avec remise dans l'échantillon observé (mettre les n valeurs dans un chapeau; tirer n fois avec remise pour créer une réplique de même taille n) La distribution Bootstrap d'une statistique est la distribution de la statistique construite sur les répliques La distribution Bootstrap fournit des informations sur la distribution d'échantillonnage de la statistique Alain Morineau 31

32 Les 3 contextes Contexte généralement utopique On peut tirer n échantillons indépendants dans la population quand elle est connue (simulations Monte Carlo) On construit la distribution d'échantillonnage réelle de la statistique Statistique mathématique On fait certaines hypothèses de commodité sur la population, convenables pour que la statistique choisie ait une distribution connue (dont les paramètres dépendent de l'échantillon) Cette distribution théorique connue est une approximation de la distribution d'échantillonnage réelle Rééchantillonnage On connaît un échantillon On rééchantillonne (répliques de l'échantillon) La distribution d'échantillonnage dans les répliques est une approximation de la distribution d'échantillonnage inconnue Alain Morineau 32

33 Réflexions sur le Bootstrap On pourrait croire qu'on crée des données à partir de rien Mais les répliques ne sont pas utilisées comme si c'étaient de nouvelles données La distribution Bootstrap de la statistique est utilisée seulement pour étudier comment la statistique varierait en fonction de l'échantillonnage Avec le Bootstrap, l'échantillon observé est en fait utilisée pour deux tâches 1. Estimer un paramètre 2. Estimer la variabilité de cette estimation (écart-type) Remarque: même double utilisation de l'échantillon dans le cas d'une distribution théorique d'échantillonnage Pour la moyenne, l'échantillon est utilisé (1) d abord pour estimer la moyenne et (2) puis pour estimer son écart-type Alain Morineau 33

34 A quoi sert la distribution Bootstrap? La distribution Bootstrap approche le centre, la forme et le biais de la distribution d'échantillonnage (inconnue) de la statistique Forme d'une distribution d'échantillonnage inconnue Par exemple, examiner si elle est proche de la normalité Valeur centrale et biais Le biais est l'écart entre la moyenne de la distribution d'échantillonnage et la vraie valeur du paramètre L'estimation Bootstrap du biais est l'écart entre la moyenne de la distribution Bootstrap et la valeur de la statistique sur l'échantillon observé Dispersion L'écart-type Bootstrap est une estimation de l'écart-type de la vraie distribution d'échantillonnage de la statistique Un cas particulier favorable Si la distribution Bootstrap est proche d'une loi normale et si le biais Bootstrap est faible, on peut estimer un intervalle de confiance de type "t de Student" pour la statistique Alain Morineau 34

35 Le Bootstrap en formules Estimateur ˆ (,,..., ) f x x x 1 2 n b-ème réplique Bootstrap, pour les k répliques (b = 1,k) Les propriétés statistiques de l'estimation seront calculées sur la distribution des répliques (dite distribution Bootstrap). En particulier: Estimation Bootstrap du paramètre Variance Bootstrap de la distribution du paramètre ˆ f ( x, x,..., x ) ( b) 1* 2* n* Var Boot ( ˆ ) Alain Morineau 35 ˆ k b 1 Boot ˆ k ( b) k b 1 ( ˆ ˆ ) ( b) k 1 Boot 2

36 Estimation Bootstrap sans biais Définition du biais d'un estimateur Estimation Bootstrap du biais (définition par analogie de formule) Biais( ˆ ) E( ˆ ) Biais ( ˆ ) ˆ ˆ Boot Boot Par définition du biais: Estimation Bootstrap sans biais E( ˆ ) Biais( ˆ ) Définition (par analogie) Calcul Résultat ˆ* ˆ ˆ Boot BiaisBoot ( ) ˆ* ˆ ˆ ˆ Boot Boot ( ) ˆ* 2 ˆ ˆ Boot Boot Alain Morineau 36

37 Le Bootstrap en bref On a un échantillon de taille n On considère la statistique qui nous intéresse c'est l'estimation du paramètre inconnu qui nous intéresse quotient, corrélation, pente d'une droite, etc. On calcule la statistique sur l'échantillon initial On calcule cette statistique sur les k répliques (j = 1 à k) La distribution empirique obtenue est la distribution Bootstrap de la statistique La distribution Bootstrap est le support de toute inférence concernant la statistique L'estimation Bootstrap du paramètre est la moyenne des k valeurs calculées sur les répliques On calcule de même son écart-type, etc. On corrige le biais éventuel de l'estimation Alain Morineau 37

38 Corriger ou non le biais? Connaître le biais n implique pas qu on le corrige nécessairement Dilemme "biais/variance": la correction de biais accroît la variance de la statistique Il est donc important de connaître le biais pour avoir un élément de réflexion dans le dilemme biais/variance Le bootstrap peut effectivement conduire à une correction de biais Alain Morineau 38

39 Les intervalles Bootstrap Intervalle "Percentile" Ré-échantillonnage Bootstrap de l échantillon réel Calcul de l estimation Bootstrap du paramètre étudié On utilise la distribution Bootstrap du paramètre Les 2,5 ème et 97,5 ème percentiles de la distribution des estimations fournissent les bornes de l'intervalle à 95%. Le nombre de répliques doit être grand Intervalle "Bootstrap t" (ou "Standard") Ré-échantillonnage Bootstrap de l échantillon réel Calcul de l estimation Bootstrap du paramètre étudié Calcul Bootstrap de l écart type du paramètre étudié Lecture dans la table de la loi Normale (ex: 1,96) ou Student à k-1 ddl Exemple pour un intervalle au seuil 95% : Student (suivant ddl) ou Normal { ; + 1,96} Utiliser seulement si la distribution Bootstrap semble assez normale, et avec un biais faible Autres variétés d'intervalles dans la littérature Alain Morineau 39

40 Intervalle Bootstrap "Percentile" La procédure la plus utilisée On calcule le paramètre pour toutes les répliques Bootstrap On sélectionne le seuil a (ex. 0,05) On définit les bornes par les percentiles: Inf = a /2 ème percentile. Sup = (1 - a /2) ème percentile. Remarque. Il existe une fonction Excel appropriée: "= QUARTILE (zone des données; 0,025)" Alain Morineau 40

41 Intervalle "Bootstrap t" ou standard Calcul direct sur la distribution des valeurs Bootstrap moyenne de la distribution écart-type de la distribution Formule «habituelle» pour l intervalle de confiance, avec les quantiles d'une loi normale ou d une loi de Student à k-1 ddl [ Inf, Sup ] ˆ m t s ; ˆ t s n 1,1 a B m n 1,1 a 2 2 Avantages : simple et intuitif : construction classique d un IC Ne pas utiliser si la distribution Bootstrap ne semble pas normal présente un biais important Inconvénients : Statistiques asymétriques? Plages de valeurs licites (cf. r²)? Ne respecte pas les transformations (par exemple la transformée pour le R²) Alain Morineau 41 B

42 Intervalle "Bootstrap t" ou standard Variance de l'estimation Var Boot ( ˆ ) k j 1 ( ˆ ˆ ) ( j) k 1 Boot 2 Ecart-type s Boot ( ˆ ) Var ( ˆ ) Boot Intervalle de confiance "t" (ou standard) [ Inf, Sup ] ˆ ( ˆ); ˆ ( ˆ Boot t s t s ) n 1,1 a Boot Boot n 1,1 a Boot 2 2 Alain Morineau 42

43 Limitations du Bootstrap Mauvais résultats si la distribution empirique construite sur l'échantillon n'est pas une bonne représentation de la vraie distribution Exemple: le cas du maximum d'un échantillon; d'une manière générale, cas des distributions à extrémités très dispersées Cas d'un échantillon de taille très faible: sa fonction de répartition n'est pas toujours une image correcte de la fonction de répartition de la population dont il est issu Le Bootstrap s'accommode bien des violations de certaines hypothèses classiques de travail (comme la normalité) mais souffre d'autres limitations (comme la non-indépendance; ex. les séries chronologiques) Petit inconvénient du rééchantillonnage: deux statisticiens travaillant sur les mêmes données, avec les mêmes méthodes, vont obtenir des résultats non identiques (selon le tirage ) Alain Morineau 43

44 Pour et contre "k fois sur le métier tu répliqueras ton ouvrage!" Attention : Ce n est pas parce que le Bootstrap sert dans beaucoup de cas qu il faut toujours faire du Bootstrap. "l abus de bootstrap peut être dangereux pour la statistique" Deux affirmations imprudentes: On ne fait aucune hypothèse sur les données On peut travailler sur des petits échantillons Cas où on n'a rien à gagner: estimation d'une moyenne et de son intervalle de confiance (sauf si non normalité forte et/ou taille faible de l'échantillon Cas où on a tout à perdre: estimations pour le maximum (ou toute distribution très asymétrique) Alain Morineau 44

45 NB. Conditions de convergence du Bootstrap Observations "iid" Convergence uniforme certaine (avec la probabilité 1) de la fonction de répartition empirique vers la fonction de répartition vraie quand la taille tend vers l'infini (théorème de Glivenko-Cantelli) Si le paramètre à estimer est une certaine fonction de la répartition vraie, l'estimateur doit être la même fonction de la répartition empirique Cette condition est satisfaite pour les moyennes, les écartstypes, les variancees, la médianes et autres quantiles Condition de continuité de l'estimateur Ce n'est pas le cas pour les statistiques d'ordre extrême comme le Min ou le Max Alain Morineau 45

46 Glivenko-Cantelli Fonction de répartition empirique (échantillon): croissante de 0 à 1, par n sauts de hauteur 1/n Elle approche la fonction de répartition théorique (inconnue) quand la taille de l échantillon augmente Alain Morineau 46

47 Le Bootstrap: quand? En cas de complexité analytique En cas de validité douteuse des conditions d application des méthodes classiques En complément de l approche classique Nombreuses applications du Bootstrap dans la bibliographie Nombreuses variantes du Bootstrap (tests et intervalles) Alain Morineau 47

48 Ce qu on a déjà dit Notre univers n'étant pas toujours "normal" (Laplace-Gauss), certaines méthodes classiques ne peuvent pas être utilisées La puissance de calcul des ordinateurs a rendu les techniques de ré-échantillonnage accessibles La philosophie de ces méthodes est l extraction du maximum d information à partir des données Les données sont utilisées pour révéler la variabilité dans la population en s'appuyant sur la variabilité intrinsèque de l échantillon (obtenue à partir des répliques) Ces méthodes ont séduit de nombreux statisticiens et praticiens par leur potentiel et leur efficacité par la simplicité de leur mise en œuvre NB. Le Bootstrap ne fait pas de miracle avec les "mauvais" échantillons (garbage in, garbage out!) Alain Morineau 48

49 Exemples et exercices du Bootstrap Corrélation Droite de régression Quotient, rapport ou taux Différence entre 2 médianes Alain Morineau 49

50 Coefficient de Corrélation (linéaire) r ( x x)( y y) i ( x x) ( y y) i i 2 2 i r = 0.85 r = 0.4 r = 1.0 Alain Morineau 50

51 y Si la population était connue Population connue connue Corrélation r = connue r = 0,801 Alain Morineau 51 x

52 Y Echantillon observé Echantillonnage de dans taille n P= 15 Alain Morineau 52 X

53 Y Corrélation empirique Echantillon Corrélation E r = empirique r = 0,840 Alain Morineau 53 X

54 Appréciation de l'écart-type Bootstrap Ecart-type "vrai" du coefficient de corrélation empirique Méthode de Monte Carlo dans la population finie connue: Construction de 5000 échantillons de taille n=15 extraits de la population connue Estimation de l'écart-type vrai à partir de la distribution des 2500 valeurs : 0,1133 Estimation "classique" par approximation normale: 0,0837 Estimation Bootstrap avec k = 500 répliques : 0,1108 Quelle est la meilleure des deux estimations? L'estimation Bootstrap est plus proche de la valeur vraie (connue ici) Alain Morineau 54

55 En bref, Bootstrap pour corrélation Problème de la corrélation : sa distribution d'échantillonnage dépend de r inconnu L'écart-type d'une moyenne ne dépend pas de m L'écart-type d'une corrélation dépend de r Problème supplémentaire : la distribution d'échantillonnage n'est absolument pas normale asymétrique, bornée par 1 et -1, Les transformations (de Fisher et les autres) constituent un certain palliatif mais restent des approximations souvent grossières Alain Morineau 55

56 Formules Bootstrap pour la corrélation Les formules sont simples mais l'écriture est fastidieuse Estimation Bootstrap ˆ r Boot 1 k k b 1 ˆ r ( b) Ecart-type Bootstrap Biais k 2 ˆ ˆ ˆ k ˆ s r r r / 1 Boot ( b) Boot b 1 Biais ˆ r ˆ r ˆ r Boot Boot Alain Morineau 56

57 Fréquence relative (%) Distributions Bootstrap (1000 répliques) Corrélation des températures en A et en B 10 Corrélation observée Corrélation Alain Morineau 57

58 Fréquence relative Intervalles percentiles (5000 répliques) Corrélation des températures en A et en B Corrélation Biais Ecart-type Intervalles percentiles: direct correction du biais Corrélations Bootstrap Alain Morineau 58

59 Régression linéaire Modèle de la régression linéaire classique: Données : (x,y) i=1, n Modèle : y = a + bx + e i Les e i sont indépendants Les e i suivent des lois normales N(0,s²) s² : variance inconnue (pour toutes les observations) Les x i sont fixés et indépendants des e i On s'intéresse souvent à la pente : b Estimation classique Critère des Moindres carrés : choisir la droite qui minimise la somme des carrés des écarts verticaux Questions Linéarité? Effets des écarts aux hypothèses de commodité? (variances égales, indépendances, normalité, points aberrants, ) Alain Morineau 59

60 Bootstrap et régression : 2 méthodes Le Bootstrap peut être défini de 2 façons, selon que les variables "x" sont considérées aléatoires ou fixes 1. Bootstrap des couples On rééchantillonne les observations par couple ("Bootstraping pairs" de Efron, ou "Bootstrap à x aléatoire") ; C'est la méthode usuelle 2. Bootstrap des résidus On fait un ajustement initial et on calcule les résidus; on recalcule les y i pour chaque x i en ajoutant un résidu qui est bootstrapé dans l'ensemble des résidus ("Bootstrap à x fixés") e (boot.) Les deux méthodes sont utilisables (quelle que soit la distribution des résidus) mais ne sont pas équivalentes Alain Morineau 60

61 Deux méthodes de Bootstrap : détails Bootstrap à «x aléatoires» : la procédure usuelle Les x sont considérés comme aléatoires On réplique les couples (x,y) pour avoir une réplique Bootstrap des données On recalcule la régression sur chaque réplique Bootstrap des données Bootstrap à «x fixes» (procédure moins fréquente) Les x sont considérés comme fixes Les y ajustés (valeurs sur la droite) sont considérés comme les espérances des valeurs y Bootstrap On réaffecte les résidus de l ajustement initial aux y ajustés du modèle initial; l ensemble des nouveau couples (x,y) est la réplique Bootstrap des données On régresse les x (toujours les mêmes) sur les nouveaux y pour obtenir les répliques Bootstrap des coefficients d intérêt Alain Morineau 61

62 Régression : quel est le "bon" Bootstrap? Bootstrap des couples (procédure usuelle) Bootstrap des résidus (les x fixes) Données avec un point "bizarre" Le Bootstrap des couples, très différent du Bootstrap des résidus, suggère l'existence d'un problème D'une façon générale, les distributions Bootstrap sont toujours "informatives" Alain Morineau 62

63 Bootstrap à x fixés (cas exceptionnel) Cette procédure implique que l ajustement du modèle linéaire aux données est correct (on Bootstrap autour de la 1 ère droite) Il faut supposer que les aléas autour des y sont correctement simulés par le rééchantillonnage dans une distribution commune Donc problème si le modèle n est pas correct (non linéarité, hétéroscédasticité, points aberrant, ) : ces défauts ne sont pas répliqués dans les répliques Bootstrap Le rééchantillonnage des résidus est plus sensible aux hypothèses sur le modèle : il faut supposer que les erreurs sont indépendantes et identiquement distribuées et que la «forme» linéaire du modèle d ajustement est pertinente Alain Morineau 63

64 Bootstrap à x aléatoires (Bootstrap des couples) Tirage aléatoire des couples avec remise Estimation des coefficients sur couples répliqués Distribution Bootstrap des coefficients Procédure valable même si les hypothèses de travail du modèle linéaire ne sont pas bien vérifiées Le processus ayant généré les données n est pas nécessairement linéaire (on observe cependant une liaison de dépendance linéaire) Alain Morineau 64

65 Régression : problèmes possibles Données manquantes Il faut supposer que les données manquantes ne sont pas un problème Il n'est pas recommandé de faire du Bootstrap après des "imputations multiples" Données dépendantes Le Bootstrap suppose que les distributions des y i sont mutuellement indépendantes (exclut les séries temporelles) Observations éloignées, influentes S'il y a des "outliers", ils ont une influence perturbatrice sur les ajustements successifs (on peut les éliminer car les répliques peuvent être très sensibles à leur présence) Alain Morineau 65

66 Bootstrap des coefficients a et b de la régression Alain Morineau 66

67 Bootstrap du R 2 et écart-type résiduel Alain Morineau 67

68 Bootstrap pour une analyse de variance Hypothèse de travail: l'échantillon reflète la population Hypothèse nulle: les traitements n'affectent pas les scores Statistique utilisée fonction de la différence entre les groupes SCE des moyennes à la moyenne générale F de Fisher (équivalent SCE) Procédure Bootstrap Mettre les 45 valeurs dans un chapeau Pour une réplique, tirer 45 fois avec remise (sous H0, chaque réplique est tirée de la même pop.mère) Affecter les 14 premières valeurs à A, les 10 suivantes à B, Calculer F et comparer à la valeur initiale pour chaque réplique Calculer la p-value sur la distribution Bootstrap Alain Morineau 68

69 Exemples de Bootstrap répliques p-value = 0, répliques p-value = 0,041 La distribution approche la loi de Fisher (pas toujours ) Alain Morineau 69

70 Autre procédure Bootstrap Sous l'hypothèse nulle d'une même population pour les 4 traitements: la moyenne dans chaque groupe est égale à la moyenne générale donc dans chaque groupe, les écarts à la moyenne du groupe suivent tous la même loi, quelque soit le groupe Traduction Bootstrap On calcule les 45 écarts entre la valeur et la moyenne de son groupe On fait le Bootstrap sur ces écarts (et non sur les observations) Alain Morineau 70

71 Bootstrap sur les écarts répliques p-value = 0, répliques p-value = 0,040 Ici: peu de différence avec le Bootstrap sur les valeurs Alain Morineau 71

72 Retour sur les hypothèses nulles du Bootstrap Ici on a les mêmes résultats pour les 2 procédures Mais si un des groupes a une moyenne très différente des autres, la distribution Bootstrap sur les valeurs: sera certainement bimodale sur les écarts: sera certainement unimodale La non-ressemblance de la distribution Bootstrap avec une distribution F apporte de l'information: les hypothèses "classiques" (qui assurent une distribution de Fisher) ne sont certainement pas vérifiées! Les 2 hypothèses nulles d'absence d'effet des médicaments ne sont pas équivalentes Bootstrap sur les valeurs: on s'intéresse d'abord à des différences de moyennes Bootstrap sur les écarts: on ignore les différences éventuelles de moyennes mais on veut tester l'effet des médicaments par une modification des dispersions On voit que le Bootstrap peut révéler une différence de moyennes, mais aussi une différence de dispersion ou même de forme Alain Morineau 72

73 Conclusion Les problèmes de coûts de calcul ont conduit la statistique dans ses débuts vers les méthodes avec peu de calcul et plus de mathématique Cette statistique classique doit s'appuyer sur des hypothèses souvent peu réalistes (liaisons linéaires, observations indépendantes "iid", distributions normales ) Les progrès extraordinaires dans le calcul rendent possibles des solutions alternatives L'analyse mathématique compliquée avec des hypothèses pourtant simplificatrices est remplaçable par des méthodes simples mais de calculs intensifs Dans ce contexte les techniques de rééchantillonnage rencontrent un succès considérable Alain Morineau 73

74 Les méthodes statistiques de calcul intensif Les méthodes statistiques de calcul intensif nécessitent beaucoup de calculs (presques identiques) sur les données Elles sont automatiques et souvent faciles à mettre en oeuvre Elles nécessitent très peu d'hypothèses sur la forme des modèles et sur les composantes aléatoires La puissance actuelle des ordinateurs les rendent possibles et faciles à utiliser Attention: les méthodes de calcul intensif ne sont pas meilleures que les méthodes classiques quand les hypothèses classiques sont satisfaites Mais elles sont plus puissantes quand ces hypothèses ne sont pas satisfaites En bref, ces méthodes peuvent résoudre de nombreux problèmes qu'on ne savait pas traiter auparavant Alain Morineau 74

75 Des dangers à prévenir Attention: le volume des calculs ne garantit pas que les données ont été bien utilisées La mise à disposition généralisée des outils de calculs et des logiciels augmente considérablement les risques d'utilisation abusive Il est important de savoir analyser dans quelles circonstances les méthodes de calcul intensif ont un apport décisif sur les méthodes classiques Important : les notions qu'il faut connaitre Estimation Variance et biais d'un estimateur Intervalle de confiance Tests usuels (t de Student) Choix et validation de modèles Alain Morineau 75

76 Bibliographie succincte Chernick, M. R. (1999) Bootstrap Methods: A Practitioner s Guide. New York: John Wiley & Sons. Davison, A. C. and D. V. Hinkley (1997). Bootstrap Methods and their Application. Cambridge Univ. Press. Diaconis, P. and B. Efron (1983). Computer intensive methods in statistics. Scientific American, 248:5, Efron, B. (1979). Computers and the theory of statistics: thinking the unthinkable. Siam Review, 21, Efron, B. and Gong, G A leisurely look at the Bootstrap, the Jackknife, and cross-validation. The American Statistician 37(1) : p Efron, B. and Tibshirani, R. J Bootstrap methods for standard errors, confidence intervals, and other measures of statistical accuracy. Statistical Science 1(1) : p Efron, B. and Tibshirani, R. J An introduction to the Bootstrap. Chapman & Hall, New York. Hjorth, Computer intensive method, statistical methods. Chapman & Hall, New York. Shao, J. and Tu, D The Jackknife and Bootstrap. Springer Young, Bootstrap : More than a stab in the dark? (with discussion) Statistical Science 9: Alain Morineau 76

77 Une référence incontournable Alain Morineau 77

78 Notre autre référence Pour son chapitre sur toutes les procédures de rééchantillonnage Pour l'utilisation d'excel Voir aussi l'onglet "Excel'Ense" sur le site de la revue MODULAD: Alain Morineau 78

79 Compléments possibles Bootstrap et analyses factorielles Bootstrap paramétrique (et semi-paramétrique) Autres intervalles de confiance Bootstrap Bootstrap et tests d'hypothèses Bootstrap et validation de modèles (Bootstrap "0.632") etc. Alain Morineau 79

80 Le rééchantillonnage : c est maintenant! Questions? Commentaires? Alain Morineau 80

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

TESTS D'HYPOTHESES Etude d'un exemple

TESTS D'HYPOTHESES Etude d'un exemple TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Incertitude et variabilité : la nécessité de les intégrer dans les modèles Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Chapitre 1 Régime transitoire dans les systèmes physiques

Chapitre 1 Régime transitoire dans les systèmes physiques Chapitre 1 Régime transitoire dans les systèmes physiques Savoir-faire théoriques (T) : Écrire l équation différentielle associée à un système physique ; Faire apparaître la constante de temps ; Tracer

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Validation probabiliste d un Système de Prévision d Ensemble

Validation probabiliste d un Système de Prévision d Ensemble Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS 1 sur 9 COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS (L'article intégral est paru dans Gestions Hospitalières n 357 de juin-juillet 1996) Pour plus d'informations concernant

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) I. L'intérêt de la conversion de données, problèmes et définitions associés. I.1. Définitions:

Plus en détail

Le WACC est-il le coût du capital?

Le WACC est-il le coût du capital? Echanges d'expériences Comptabilité et communication financière Dans une évaluation fondée sur la méthode DCF, l objectif premier du WACC est d intégrer l impact positif de la dette sur la valeur des actifs.

Plus en détail

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

CONCEPTION ET TIRAGE DE L ÉCHANTILLON CHAPITRE 4 CONCEPTION ET TIRAGE DE L ÉCHANTILLON Ce chapitre technique 1 s adresse principalement aux spécialistes de sondage, mais aussi au coordinateur et aux autres responsables techniques de l enquête.

Plus en détail

SIG ET ANALYSE EXPLORATOIRE

SIG ET ANALYSE EXPLORATOIRE SIG ET ANALYSE EXPLORATOIRE VERS DE NOUVELLES PRATIQUES EN GÉOGRAPHIE Jean-Marc ORHAN Equipe P.A.R.I.S., URA 1243 du CNRS Paris Résumé L'offre actuelle dans le domaine des logiciels de type Système d'information

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Mesure et gestion des risques d assurance

Mesure et gestion des risques d assurance Mesure et gestion des risques d assurance Analyse critique des futurs référentiels prudentiel et d information financière Congrès annuel de l Institut des Actuaires 26 juin 2008 Pierre THEROND ptherond@winter-associes.fr

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE Yannick MACÉ Statisticien-Economiste Responsable du Secteur Analyses Techniques, Groupama (C.C.A.M.A.)

Plus en détail

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application

Plus en détail