C. Lalanne. 22 février 2005 LENA, CNRS UPR 640. C. Lalanne. Introduction

Dimension: px
Commencer à balayer dès la page:

Download "C. Lalanne. 22 février 2005 LENA, CNRS UPR 640. C. Lalanne. Introduction"

Transcription

1 Statistiques Appliquées à l Expérimentation en Sciences Humaines LENA, CNRS UPR février 2005 Analyse

2 Objectifs : recueillir recueil et traitement de données numériques décrire production de résumés numériques et graphiques synthétiques inférer analyse inférentielle Organisation : ce qui sera traité. ce qui sera survolé. ce qui ne sera pas traité. s il reste du temps, s il y a des questions... Analyse

3 Objectifs : recueillir recueil et traitement de données numériques décrire production de résumés numériques et graphiques synthétiques inférer analyse inférentielle Organisation : ce qui sera traité. ce qui sera survolé. ce qui ne sera pas traité. s il reste du temps, s il y a des questions... Analyse

4 Objectifs : recueillir recueil et traitement de données numériques décrire production de résumés numériques et graphiques synthétiques inférer analyse inférentielle Organisation : ce qui sera traité. ce qui sera survolé. ce qui ne sera pas traité. s il reste du temps, s il y a des questions... Analyse

5 Objectifs : recueillir recueil et traitement de données numériques décrire production de résumés numériques et graphiques synthétiques inférer analyse inférentielle Organisation : ce qui sera traité. ce qui sera survolé. ce qui ne sera pas traité. s il reste du temps, s il y a des questions... Analyse

6 résumer transformer les données brutes en un ensemble d indicateurs descriptifs (échantillon) décrire caractériser la distribution des observations (univarié), comparer les distributions (multivarié) et analyser les effets des facteurs en fonction du type de variable (quantitative/quantitative, quantitative/qualitative, etc.) (échantillon) expliquer / prédire généraliser les résultats observés sur la population non observée, expliquer la variabilité, prédire des valeurs non observées en fonction d un modèle linéaire (population) Analyse

7 résumer transformer les données brutes en un ensemble d indicateurs descriptifs (échantillon) décrire caractériser la distribution des observations (univarié), comparer les distributions (multivarié) et analyser les effets des facteurs en fonction du type de variable (quantitative/quantitative, quantitative/qualitative, etc.) (échantillon) expliquer / prédire généraliser les résultats observés sur la population non observée, expliquer la variabilité, prédire des valeurs non observées en fonction d un modèle linéaire (population) Analyse

8 résumer transformer les données brutes en un ensemble d indicateurs descriptifs (échantillon) décrire caractériser la distribution des observations (univarié), comparer les distributions (multivarié) et analyser les effets des facteurs en fonction du type de variable (quantitative/quantitative, quantitative/qualitative, etc.) (échantillon) expliquer / prédire généraliser les résultats observés sur la population non observée, expliquer la variabilité, prédire des valeurs non observées en fonction d un modèle linéaire (population) Analyse

9 situation expérimentale situation contrôlée - effet exclusif du ou des facteur(s) d étude (hypothèse générale) protocole expérimental formaliser cette situation expérimentale à l aide de méthodes spécifiques d allocation des sujets et de répartition des conditions expérimentales notion de plan expérimental (hypothèse(s) opérationnelle(s)) Analyse

10 situation expérimentale situation contrôlée - effet exclusif du ou des facteur(s) d étude (hypothèse générale) protocole expérimental formaliser cette situation expérimentale à l aide de méthodes spécifiques d allocation des sujets et de répartition des conditions expérimentales notion de plan expérimental (hypothèse(s) opérationnelle(s)) Analyse

11 un peu de vocabulaire... observation, effectif, individu, unité statistique échantillon, groupe, population (parente ou ) variable, facteur, caractère niveau, modalité, traitement Analyse

12 variable = constituée d un ensemble de modalités mutuellement exclusives définissant son domaine de variation. variables qualitative ou quantitative - ordinale, nominale, dichotomisée - discrète, continue variables dépendante et indépendante - VD = variable mesurée - VI = variable manipulée (invoquée ou provoquée) Analyse

13 variable = constituée d un ensemble de modalités mutuellement exclusives définissant son domaine de variation. variables qualitative ou quantitative - ordinale, nominale, dichotomisée - discrète, continue variables dépendante et indépendante - VD = variable mesurée - VI = variable manipulée (invoquée ou provoquée) Analyse

14 différentes méthodes d allocation des sujets dans différentes conditions expérimentales définies par les variables de l étude (i.e. facteurs) groupes indépendants individus différents dans les groupes (ou conditions) (pas de corrélation entre résultats) groupes appariés mêmes individus dans les différentes conditions (corrélation inter-conditions liée à l appariement) mesures répétées chaque i-ème individu passe toutes les conditions ( généralisation de l appariement) Intérêt : décomposer les différentes sources de variation de la VD variabilité expliquée par le(s) facteur(s) vs. fluctuations aléatoires Analyse

15 différentes méthodes d allocation des sujets dans différentes conditions expérimentales définies par les variables de l étude (i.e. facteurs) groupes indépendants individus différents dans les groupes (ou conditions) (pas de corrélation entre résultats) groupes appariés mêmes individus dans les différentes conditions (corrélation inter-conditions liée à l appariement) mesures répétées chaque i-ème individu passe toutes les conditions ( généralisation de l appariement) Intérêt : décomposer les différentes sources de variation de la VD variabilité expliquée par le(s) facteur(s) vs. fluctuations aléatoires Analyse

16 différentes méthodes d allocation des sujets dans différentes conditions expérimentales définies par les variables de l étude (i.e. facteurs) groupes indépendants individus différents dans les groupes (ou conditions) (pas de corrélation entre résultats) groupes appariés mêmes individus dans les différentes conditions (corrélation inter-conditions liée à l appariement) mesures répétées chaque i-ème individu passe toutes les conditions ( généralisation de l appariement) Intérêt : décomposer les différentes sources de variation de la VD variabilité expliquée par le(s) facteur(s) vs. fluctuations aléatoires Analyse

17 Formalisme particulier 2 notions pour les relations k-aires entre variables : relation d emboîtement S < G > relation de croisement S T e.g. un facteur de groupement/classification (sexe des sujets) et un facteur croisé (type d items présenté) plan : S < A > B - facteurs élémentaires = A, B, S(A) - termes d interaction = AB, BS(A) Analyse

18 Formalisme particulier 2 notions pour les relations k-aires entre variables : relation d emboîtement S < G > relation de croisement S T e.g. un facteur de groupement/classification (sexe des sujets) et un facteur croisé (type d items présenté) plan : S < A > B - facteurs élémentaires = A, B, S(A) - termes d interaction = AB, BS(A) Analyse

19 Formalisme particulier 2 notions pour les relations k-aires entre variables : relation d emboîtement S < G > relation de croisement S T e.g. un facteur de groupement/classification (sexe des sujets) et un facteur croisé (type d items présenté) plan : S < A > B - facteurs élémentaires = A, B, S(A) - termes d interaction = AB, BS(A) Analyse

20 2 exemples de plans classiques : plan factoriel plan en carré latin permet de ventiler les conditions au travers d un nombre optimal de sujets Analyse

21 2 exemples de plans classiques : plan factoriel plan en carré latin permet de ventiler les conditions au travers d un nombre optimal de sujets Analyse

22 2 exemples de plans classiques : plan factoriel plan en carré latin permet de ventiler les conditions au travers d un nombre optimal de sujets Analyse

23 e.g. 2 facteurs A et B à 2 et 3 modalités : S 3 < A 2 B 3 > ou S 6 < B 3 > A 2 et carré latin à 3 facteurs A 2 B 3 s7, s8, s9 s10, s11, s12 s1, s2, s3 s4, s5, s6 s13, s14, s15 s16, s17, s18 A 2 B 3 s4, s5, s6 s4, s5, s6 s1, s2, s3 s1, s2, s3 s7, s8, s9 s7, s8, s9 B 3 A 3 a2b1c2 a2b2c3 a2b3c1 a1b1c1 a1b2c2 a1b3c3 a3b1c3 a3b2c1 a3b3c2 Analyse

24 résumer l information - codage, recodage des données - différentes représentations numériques : effectifs, effectifs cumulés, fréquences, fréquences cumulées,... - différents indicateurs de synthèse : tendance centrale, dispersion,... - différentes représentations graphiques : diagramme en bâtonnets, histogrammes, boîtes à moustaches,... décrire l information - situer un individu (ou une observation) dans la distribution d effectifs (cas univarié) - caractériser les liaisons entre variables (cas bivarié) L analyse univariée précède toujours l analyse bivariée! étape préalable indispensable à l analyse inférentielle Analyse

25 résumer l information - codage, recodage des données - différentes représentations numériques : effectifs, effectifs cumulés, fréquences, fréquences cumulées,... - différents indicateurs de synthèse : tendance centrale, dispersion,... - différentes représentations graphiques : diagramme en bâtonnets, histogrammes, boîtes à moustaches,... décrire l information - situer un individu (ou une observation) dans la distribution d effectifs (cas univarié) - caractériser les liaisons entre variables (cas bivarié) L analyse univariée précède toujours l analyse bivariée! étape préalable indispensable à l analyse inférentielle Analyse

26 résumer l information - codage, recodage des données - différentes représentations numériques : effectifs, effectifs cumulés, fréquences, fréquences cumulées,... - différents indicateurs de synthèse : tendance centrale, dispersion,... - différentes représentations graphiques : diagramme en bâtonnets, histogrammes, boîtes à moustaches,... décrire l information - situer un individu (ou une observation) dans la distribution d effectifs (cas univarié) - caractériser les liaisons entre variables (cas bivarié) L analyse univariée précède toujours l analyse bivariée! étape préalable indispensable à l analyse inférentielle Analyse

27 résumer l information - codage, recodage des données - différentes représentations numériques : effectifs, effectifs cumulés, fréquences, fréquences cumulées,... - différents indicateurs de synthèse : tendance centrale, dispersion,... - différentes représentations graphiques : diagramme en bâtonnets, histogrammes, boîtes à moustaches,... décrire l information - situer un individu (ou une observation) dans la distribution d effectifs (cas univarié) - caractériser les liaisons entre variables (cas bivarié) L analyse univariée précède toujours l analyse bivariée! étape préalable indispensable à l analyse inférentielle Analyse

28 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

29 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

30 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

31 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

32 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

33 cas univarié indicateurs de tendance centrale indicateurs de dispersion indicateurs de forme de la distribution cas bivarié indicateurs de différence : variables quantitative/qualitative indicateurs : variables quantitative/quantitative indicateurs : variables quantitative/qualitative Analyse

34 Mode valeur de la variable étudiée associée au plus grand nombre d observations e.g. âges (arrondis à l année) relevés dans une classe : mode = 16 (observé 6 fois) variables ordinales Médiane valeur telle que 50 % des effectifs sont situés avant med = 16 (var discrète : calcul à partir des effectifs cumulés) variables nominales, quantitatives (discrètes/continues) Analyse

35 Mode valeur de la variable étudiée associée au plus grand nombre d observations e.g. âges (arrondis à l année) relevés dans une classe : mode = 16 (observé 6 fois) variables ordinales Médiane valeur telle que 50 % des effectifs sont situés avant med = 16 (var discrète : calcul à partir des effectifs cumulés) variables nominales, quantitatives (discrètes/continues) Analyse

36 Méthode de calcul de la médiane cas discret : à partir des effectifs cumulés N i e.g. effectifs d une classe de neige en fonction de l âge x i n i N i f i F i rang médian (n/2 ou n/2 + 1 suivant la parité de n) - médiane = valeur VD correspondante au rang médian ici, rang médian = 13.5 med = 16 Analyse

37 Illustration sur un histogramme (e.g. même type de données regroupées par classe) : cas continu : formule d interpolation [ ( n x med = x 2 med + N ] med 1) h n med formule d accroissement appliquée aux données représentées sur une courbe des effectifs cumulés Analyse

38 Moyenne arithmétique centre de gravité, quantification ou x = 1 n x = n i=1 x i n p i x i i=1 avec p i = n i /n > 0 et i p i = 1. Remarque. Autres types de moyenne (géométrique, harmonique, quadratique)... Analyse

39 Comment quantifier la dispersion des notes autour des indicateurs de tendance centrale? e.g. différentes mesures des écarts associés aux valeurs centrales (médiane et moyenne) Analyse

40 Étendue - écart entre valeur max et valeur min - sensible aux valeurs extrêmes Intervalle inter-quantile - écart entre 1er et 3ème quartile - moins sensible aux valeurs extrêmes Écarts à la moyenne - (x i x) ou x i x - indices relatifs, ne renseignent que sur les écarts locaux - sensible aux valeurs extrêmes Écart moyen (EAM) - moyenne des écarts absolus à la moyenne : EAM = 1 n n x i x i=1 - sensible aux valeurs extrêmes Analyse

41 Étendue - écart entre valeur max et valeur min - sensible aux valeurs extrêmes Intervalle inter-quantile - écart entre 1er et 3ème quartile - moins sensible aux valeurs extrêmes Écarts à la moyenne - (x i x) ou x i x - indices relatifs, ne renseignent que sur les écarts locaux - sensible aux valeurs extrêmes Écart moyen (EAM) - moyenne des écarts absolus à la moyenne : EAM = 1 n n x i x i=1 - sensible aux valeurs extrêmes Analyse

42 Étendue - écart entre valeur max et valeur min - sensible aux valeurs extrêmes Intervalle inter-quantile - écart entre 1er et 3ème quartile - moins sensible aux valeurs extrêmes Écarts à la moyenne - (x i x) ou x i x - indices relatifs, ne renseignent que sur les écarts locaux - sensible aux valeurs extrêmes Écart moyen (EAM) - moyenne des écarts absolus à la moyenne : EAM = 1 n n x i x i=1 - sensible aux valeurs extrêmes Analyse

43 Étendue - écart entre valeur max et valeur min - sensible aux valeurs extrêmes Intervalle inter-quantile - écart entre 1er et 3ème quartile - moins sensible aux valeurs extrêmes Écarts à la moyenne - (x i x) ou x i x - indices relatifs, ne renseignent que sur les écarts locaux - sensible aux valeurs extrêmes Écart moyen (EAM) - moyenne des écarts absolus à la moyenne : EAM = 1 n n x i x i=1 - sensible aux valeurs extrêmes Analyse

44 Somme des carrés des écarts - (x i x) 2 - sensible aux valeurs extrêmes - propriétés intéressantes : écarts quadratiques Variance - moyenne des écarts quadratiques - formule : V (x) = 1 n (x i x) 2 n i=1 - sensible aux valeurs extrêmes - non-interprétable dans l unité de mesure, mais propriétés intéressantes pour l inférence Analyse

45 Somme des carrés des écarts - (x i x) 2 - sensible aux valeurs extrêmes - propriétés intéressantes : écarts quadratiques Variance - moyenne des écarts quadratiques - formule : V (x) = 1 n (x i x) 2 n i=1 - sensible aux valeurs extrêmes - non-interprétable dans l unité de mesure, mais propriétés intéressantes pour l inférence Analyse

46 Écart-type - racine carrée de la variance - sensible aux valeurs extrêmes - exprimé dans l unité de mesure Coefficient de variation - pondération de l écart-type en fonction de la moyenne - formule : cv x = σ x x utile pour la comparaison de groupes non-homogènes du point de vue de leurs moyennes Analyse

47 Écart-type - racine carrée de la variance - sensible aux valeurs extrêmes - exprimé dans l unité de mesure Coefficient de variation - pondération de l écart-type en fonction de la moyenne - formule : cv x = σ x x utile pour la comparaison de groupes non-homogènes du point de vue de leurs moyennes Analyse

48 différents moyens d étude : alignement des indicateurs de tendance centrale e.g. mode < médiane < moyenne : asymétrie à droite indicateurs caractéristiques (moments centrés d ordre 3 et 4) Coefficient d asymétrie moyenne des cubes des valeurs centrées-réduites des observations symétrie relative de la distribution d effectifs par rapport à la moyenne Coefficient d aplatissement moyenne des puissances quatrièmes des observations centrées-réduites mesure de dispersion exprimée en fonction de la valeur de la moyenne ± son écart-type Remarque. toujours en référence à une distribution normale Analyse

49 différents moyens d étude : alignement des indicateurs de tendance centrale e.g. mode < médiane < moyenne : asymétrie à droite indicateurs caractéristiques (moments centrés d ordre 3 et 4) Coefficient d asymétrie moyenne des cubes des valeurs centrées-réduites des observations symétrie relative de la distribution d effectifs par rapport à la moyenne Coefficient d aplatissement moyenne des puissances quatrièmes des observations centrées-réduites mesure de dispersion exprimée en fonction de la valeur de la moyenne ± son écart-type Remarque. toujours en référence à une distribution normale Analyse

50 Différence entre deux échantillons quantifier une différence, du point de vue d une variable quantitative, entre deux échantillons définis par une variable qualitative (facteur) : notion d effet d un facteur effet moyen d obs - d obs = x 1 x 2 - interprétation sens et ampleur (critères sémantiques) effet calibré EC - EC = d obs /s (s = variance intra) - interprétation sens et ampleur (critères psychométriques) - Critères psychométriques : - EC < 1/3, l effet est considéré comme faible ; - 1/3 EC 2/3, l effet est considéré comme intermédiaire ; - EC > 2/3, l effet est considéré comme important. Analyse

51 Différence entre deux échantillons quantifier une différence, du point de vue d une variable quantitative, entre deux échantillons définis par une variable qualitative (facteur) : notion d effet d un facteur effet moyen d obs - d obs = x 1 x 2 - interprétation sens et ampleur (critères sémantiques) effet calibré EC - EC = d obs /s (s = variance intra) - interprétation sens et ampleur (critères psychométriques) - Critères psychométriques : - EC < 1/3, l effet est considéré comme faible ; - 1/3 EC 2/3, l effet est considéré comme intermédiaire ; - EC > 2/3, l effet est considéré comme important. Analyse

52 Liaison var. quantitative/quantitative liaison entre 2 variables numériques continues : association linéaire Attention : pas nécessairement de relation de causalité entre les variables! 2 indicateurs : covariance cov(x, y) = i (x i x)(y i ȳ) coefficient de corrélation linéaire (Bravais Pearson) r xy = cov(x, y) σ x σ y r 1 Analyse

53 Liaison var. quantitative/quantitative mesurent le degré d association linéaire r xy est plus facilement interprétable car indicateur borné On distinguera le sens de la liaison (signe de r) et son ampleur (valeur absolue de r) Critères (psychométriques) : - r < 0.20 : corrélation faible - r > 0.40 : corrélation forte (dépend également du contexte) Analyse

54 Liaison var. quantitative/quantitative Autre indicateur : coefficient de détermination R 2 = r 2 xy indique la part de variabilité de Y expliquée par la prise en compte de la liaison linéaire Critères (psychométriques) : - 0 R 2 < 0.04 : R 2 faible R : R 2 intermédiaire - R 2 > 0.16 : R 2 important Analyse

55 Liaison var. quantitative/quantitative Ne pas négliger l interprétation graphique... Analyse

56 Liaison var. quantitative/quantitative... tout en prenant garde aux unités des axes! Analyse

57 Liaison var. quantitative/qualitative variabilité totale observée sur n sujets répartis en plusieurs groupes (facteur) : V totale = V inter + V intra i.e. fluctuations inter-groupes (V inter ) et intra-groupes (V intra ) Qauntification de la liaison entre la variable qualitative (facteur) et les réponses observées (variable quantitative quelconque)? η 2, rapport de variance η 2 = V inter V totale mesure analogue au coefficient de détermination ; mêmes critères d interprétation... Analyse

58 Objectifs des procédures inférentielles - échantillon extrait d une population parente non observée - effet moyen d un ou plusieurs facteurs sur VD mesurée au travers de cette échantillon - généralisation à la population parente : effet parent? estimation paramètres de population décision concernant un modèle probabiliste Analyse

59 Objectifs des procédures inférentielles - échantillon extrait d une population parente non observée - effet moyen d un ou plusieurs facteurs sur VD mesurée au travers de cette échantillon - généralisation à la population parente : effet parent? estimation paramètres de population décision concernant un modèle probabiliste Analyse

60 Formalisme notations : - échantillon : x, s 2,... - population : µ, σ,... notions d estimateur : estimer les paramètres de population à partir de l échantillon... moyenne empirique x = estimateur sans biais de la moyenne de population µ mais variance classique doit être corrigée car sous-estime la variance de population (estimateur biaisé) : s 2 = variance classique avec dénominateur à n 1 estimation ponctuelle Analyse

61 Formalisme notations : - échantillon : x, s 2,... - population : µ, σ,... notions d estimateur : estimer les paramètres de population à partir de l échantillon... moyenne empirique x = estimateur sans biais de la moyenne de population µ mais variance classique doit être corrigée car sous-estime la variance de population (estimateur biaisé) : s 2 = variance classique avec dénominateur à n 1 estimation ponctuelle Analyse

62 Formalisme notations : - échantillon : x, s 2,... - population : µ, σ,... notions d estimateur : estimer les paramètres de population à partir de l échantillon... moyenne empirique x = estimateur sans biais de la moyenne de population µ mais variance classique doit être corrigée car sous-estime la variance de population (estimateur biaisé) : s 2 = variance classique avec dénominateur à n 1 estimation ponctuelle Analyse

63 Loi normale loi normale N (µ; σ) = loi continue à 2 paramètres, très utilisée en statistiques et en calcul des probabilités f (x) = 1 σ 2π e (x µ) 2 2σ 2 forme de la distribution d échantillonnage de la moyenne : X N (µ; σ/ n) Remarque. loi (faible) des grands nombres, théorème central limite... Analyse

64 Loi normale loi normale N (µ; σ) = loi continue à 2 paramètres, très utilisée en statistiques et en calcul des probabilités f (x) = 1 σ 2π e (x µ) 2 2σ 2 forme de la distribution d échantillonnage de la moyenne : X N (µ; σ/ n) Remarque. loi (faible) des grands nombres, théorème central limite... Analyse

65 Loi normale loi normale N (µ; σ) = loi continue à 2 paramètres, très utilisée en statistiques et en calcul des probabilités f (x) = 1 σ 2π e (x µ) 2 2σ 2 forme de la distribution d échantillonnage de la moyenne : X N (µ; σ/ n) Remarque. loi (faible) des grands nombres, théorème central limite... Analyse

66 Loi normale loi normale centrée-réduite N (0; 1) : z i = x i x σ Avantage : la fonction de répartition est tabulée ; on connaît donc la proportion des valeurs situées avant une certaine valeur Analyse

67 Loi normale loi normale centrée-réduite N (0; 1) : z i = x i x σ Avantage : la fonction de répartition est tabulée ; on connaît donc la proportion des valeurs situées avant une certaine valeur Analyse

68 Calcul élémentaire de probabilités e.g. distribution théorique de la taille des individus (sexe masculin, nationalité française, âge ans) = N (170; 10) P(X < 185) = P(Z < ) = P(X > 198) = 1 P(X < 198) = 1 P(Z < ) = P(174 < X < 186) = P(X < 186) P(X < 174) = P(Z < ) P(Z < ) = Analyse

69 Calcul élémentaire de probabilités e.g. distribution théorique de la taille des individus (sexe masculin, nationalité française, âge ans) = N (170; 10) P(X < 185) = P(Z < ) = P(X > 198) = 1 P(X < 198) = 1 P(Z < ) = P(174 < X < 186) = P(X < 186) P(X < 174) = P(Z < ) P(Z < ) = Analyse

70 Intervalles de confiance - PP connue X N (µ; σ/ n) alors la statistique Z = x µ σ/ N (0; 1) n et P( z α/2 Z z α/2 ) = 1 α d où IC 100(1 α) = [ X zα/2 σ/ n; X + z α/2 σ/ n ] Analyse

71 Intervalles de confiance - PP connue X N (µ; σ/ n) alors la statistique Z = x µ σ/ N (0; 1) n et P( z α/2 Z z α/2 ) = 1 α d où IC 100(1 α) = [ X zα/2 σ/ n; X + z α/2 σ/ n ] Analyse

72 Intervalles de confiance - PP connue X N (µ; σ/ n) alors la statistique Z = x µ σ/ N (0; 1) n et P( z α/2 Z z α/2 ) = 1 α d où IC 100(1 α) = [ X zα/2 σ/ n; X + z α/2 σ/ n ] Analyse

73 Intervalles de confiance - PP inconnue σ inconnue... même raisonnement mais avec la statistique T = X µ S/ n T (n 1) loi de Student intervalle de confiance construit de manière identique : IC 100(1 α) = [ X tα/2 S/ n; X + t α/2 S/ n ] avec S comme estimé de la variance parente. Analyse

74 Intervalles de confiance - PP inconnue σ inconnue... même raisonnement mais avec la statistique T = X µ S/ n T (n 1) loi de Student intervalle de confiance construit de manière identique : IC 100(1 α) = [ X tα/2 S/ n; X + t α/2 S/ n ] avec S comme estimé de la variance parente. Analyse

75 Intervalles de confiance - PP inconnue σ inconnue... même raisonnement mais avec la statistique T = X µ S/ n T (n 1) loi de Student intervalle de confiance construit de manière identique : IC 100(1 α) = [ X tα/2 S/ n; X + t α/2 S/ n ] avec S comme estimé de la variance parente. Analyse

76 Intervalles de confiance - PP inconnue σ inconnue... même raisonnement mais avec la statistique T = X µ S/ n T (n 1) loi de Student intervalle de confiance construit de manière identique : IC 100(1 α) = [ X tα/2 S/ n; X + t α/2 S/ n ] avec S comme estimé de la variance parente. Analyse

77 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

78 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

79 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

80 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

81 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

82 Principe des tests statistiques test d hypothèse : schéma d inférence statistiques et lois de distribution type d hypothèse alternative (orientée ou non) risque d erreur et seuil de décision, puissance des tests conditions d application (paramétriques vs. non-paramétriques), robustesse des tests interprétation Test de typicalité Analyse

83 différentes techniques en fonction du type de variables, et en fonction du protocole expérimental... 1 ou 2 échantillon(s) : comparaison de moyennes 1 var. quantitative/1 var. qualitative : ANOVA à un seul facteur (modèles I et II) 1 var. quantitative/p var. qualitatives : ANOVA à plusieurs facteurs (modèles I, II, III ; plan factoriel/hiérarchique/bloc/mesures répétées) 1 var. quantitative/1 var. quantitative : Corrélation/Régression 1 var. quantitative/p var. quantitatives : Régression multiple 2 var. quantitatives/1 var. qualitative : Analyse de Covariance Analyse

84 p var. quantitatives/q var. qualitatives : Analyse de variance multivariée 1 var. qualitative/p var. quantitatives : Analyse Discriminante 1 var qualitative/p var. qualitatives : Régression logistique sans oublier les méthodes d analyse factorielle simples et multiples, sans visée inférentielle : ACP, AFC, ACM, etc. Analyse

85 Analyse

86 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

87 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

88 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

89 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

90 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

91 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

92 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

93 Données. - 1 VD numérique quelconque - 1 échantillon sélectionné au hasard, n observations ( x, s x ) Question. L échantillon observé provient-il de la même population que la population? (test de conformité) Conditions d applications. normalité Hypothèses. H 0 : µ = µ 0 ; H 1 : µ µ 0 (non orientée) ou H 1 : µ > µ 0 (orientée) ou H 1 : µ < µ 0 (orientée) Remarque. H 0 : µ = µ 0 µ µ 0 = 0 H 1 : µ > µ 0 µ µ 0 > 0 Analyse

94 Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X = P n i=1 (x i x) 2 n 1 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = X µ 0 s X n (variance corrigée de l échantillon) loi de Student a (n 1) dl Analyse

95 Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X = P n i=1 (x i x) 2 n 1 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = X µ 0 s X n (variance corrigée de l échantillon) loi de Student a (n 1) dl Analyse

96 Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X = P n i=1 (x i x) 2 n 1 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = X µ 0 s X n (variance corrigée de l échantillon) loi de Student a (n 1) dl Analyse

97 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

98 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

99 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

100 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

101 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

102 Echantillons indépendants Données. - 1 VD numérique quelconque - 2 échantillons indépendants sélectionnés au hasard, n 1 et n 2 observations ( x 1, s x1, x 2, s x2 ) indépendants = pas de corrélation entre les deux séries d observations (2 groupes de sujets différents) Question. Les échantillons observés proviennent-ils de la même population parente ou de populations ayant des caractéristiques similaires? Conditions d applications. normalité (iid) homogénéité des variances (homoscédasticité) Hypothèses. H 0 : µ 1 = µ 2 ; H 1 : µ 1 µ 2 (non orientée) ou H 1 : µ 1 > µ 2 (orientée) ou H 1 : µ 1 < µ 2 (orientée) Analyse

103 Echantillons indépendants Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X1 X 2 commune) = s2 c n 1 + s2 c n 2 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = t obs = X 1 X 2 s X1 X 2 où s 2 c = SC1+SC2 ν 1+ν 2 (variance loi de Student a (n 1 + n 2 2) dl Analyse

104 Echantillons indépendants Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X1 X 2 commune) = s2 c n 1 + s2 c n 2 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = t obs = X 1 X 2 s X1 X 2 où s 2 c = SC1+SC2 ν 1+ν 2 (variance loi de Student a (n 1 + n 2 2) dl Analyse

105 Echantillons indépendants Seuil de décision. - H 1 non-orientée test bilatéral, risque de première espèce α - H 1 orientée test unilatéral, risque de première espèce α/2 Statistique de test. avec s X1 X 2 commune) = s2 c n 1 + s2 c n 2 Décision. rejet H 0 ssi t obs > t α,n 1 t obs = t obs = X 1 X 2 s X1 X 2 où s 2 c = SC1+SC2 ν 1+ν 2 (variance loi de Student a (n 1 + n 2 2) dl Analyse

106 Test approximatif de Welch si hypothèse d homoscédasticité non vérifiée : Statistique de test. t obsw = X 1 X 2 s 2 1 n 1 + s2 2 n 2 à comparer à la distribution du t de Student avec ν = «s n + s2 2 1 n2 s 1 2! 2 n 1 n s 2 2! 2 n 2 n 2 1 ddl Analyse

107 Echantillons appariés même principe général, sauf que l on prend en compte l appariement des observations... On se ramène au cas de la comparaison d un échantillon à une moyenne théorique en dérivant le protocole par différence, et en posant H 0 : µ 1 µ 2 = 0 vs. H 1 : µ 1 µ 2 0 (non orientée) Statistique de test. t obs = X 1 X 2 sd 2 n où sd 2 est la variance (estimée) de l échantillon dérivé par différence. Remarque. sd 2 = s2 1 + s2 2 2ρs 1s 2 Analyse

108 Echantillons appariés même principe général, sauf que l on prend en compte l appariement des observations... On se ramène au cas de la comparaison d un échantillon à une moyenne théorique en dérivant le protocole par différence, et en posant H 0 : µ 1 µ 2 = 0 vs. H 1 : µ 1 µ 2 0 (non orientée) Statistique de test. t obs = X 1 X 2 sd 2 n où sd 2 est la variance (estimée) de l échantillon dérivé par différence. Remarque. sd 2 = s2 1 + s2 2 2ρs 1s 2 Analyse

109 Echantillons appariés même principe général, sauf que l on prend en compte l appariement des observations... On se ramène au cas de la comparaison d un échantillon à une moyenne théorique en dérivant le protocole par différence, et en posant H 0 : µ 1 µ 2 = 0 vs. H 1 : µ 1 µ 2 0 (non orientée) Statistique de test. t obs = X 1 X 2 sd 2 n où sd 2 est la variance (estimée) de l échantillon dérivé par différence. Remarque. sd 2 = s2 1 + s2 2 2ρs 1s 2 Analyse

110 Alternatives non-paramétriques échantillons indépendants Wilcoxon-Mann-Whitney échantillons appariés Wilcoxon (test des signes) Analyse

111 Alternatives non-paramétriques échantillons indépendants Wilcoxon-Mann-Whitney échantillons appariés Wilcoxon (test des signes) Analyse

112 Lors d une expérimentation médicale, on a relevé le temps de sommeil de 10 patients sous l effet de deux médicaments. Chaque sujet a pris successivement l un et l autre des deux médicaments. Ces données ont été recueillies pour tester l hypothèse que le médicament m2 est plus efficace que le médicament m1. i1 i2 i3 i4 i5 i6 i7 i8 i9 i10 m m Analyse

113 Analyse

114 Analyse

115 H 0 : µ 2 = µ 1 vs. H 1 : µ 2 > µ 1 (hypothèse orientée) α = Procédure manuelle : t obs = d obs s 2 n = conclusion : test significatif, rejet H 0 = 4.06 > t 0.005,9 = Analyse

116 ANOVA d ordre 1 : Comparaison de k moyennes ANOVA = ANalysis Of VAriance généralisation de la comparaison de 2 moyennes à k moyennes 1 variable de classement = facteur à k modalités 2 questions : effet global du facteur? effets spécifiques du facteur? 2 techniques : ANOVA comparaisons multiples Analyse

117 ANOVA d ordre 1 : Comparaison de k moyennes ANOVA = ANalysis Of VAriance généralisation de la comparaison de 2 moyennes à k moyennes 1 variable de classement = facteur à k modalités 2 questions : effet global du facteur? effets spécifiques du facteur? 2 techniques : ANOVA comparaisons multiples Analyse

118 ANOVA d ordre 1 : Comparaison de k moyennes ANOVA = ANalysis Of VAriance généralisation de la comparaison de 2 moyennes à k moyennes 1 variable de classement = facteur à k modalités 2 questions : effet global du facteur? effets spécifiques du facteur? 2 techniques : ANOVA comparaisons multiples Analyse

119 Types d ANOVA différents modèles d ANOVA : modèle I : effets fixes modèle II : effets aléatoires modèle III : effets mixtes (uniquement pour les ANOVA à plusieurs facteurs) et différents types de plan : plan factoriel plan hiérarchique plan avec blocs plan avec mesures répétées avec ou sans réplication Analyse

120 Données Données. - 1 VD numérique quelconque - 1 VI qualitative (facteur à k modalités) : k échantillons indépendants sélectionnés au hasard, n k observations organisation dans un tableau : - observations en lignes - modalités du facteur en colonnes g 1 g 2... g i... g k X 11 X X i1... X k1 X 12 X X i2... X k2 X 13 X X i3... X k X 1j X 2j... X ij... X kj X 1n1 X 2n2... X ini... X 1 X 2... X i... X kni X k X Analyse

121 Données Données. - 1 VD numérique quelconque - 1 VI qualitative (facteur à k modalités) : k échantillons indépendants sélectionnés au hasard, n k observations organisation dans un tableau : - observations en lignes - modalités du facteur en colonnes g 1 g 2... g i... g k X 11 X X i1... X k1 X 12 X X i2... X k2 X 13 X X i3... X k X 1j X 2j... X ij... X kj X 1n1 X 2n2... X ini... X 1 X 2... X i... X kni X k X Analyse

122 Données Données. - 1 VD numérique quelconque - 1 VI qualitative (facteur à k modalités) : k échantillons indépendants sélectionnés au hasard, n k observations organisation dans un tableau : - observations en lignes - modalités du facteur en colonnes g 1 g 2... g i... g k X 11 X X i1... X k1 X 12 X X i2... X k2 X 13 X X i3... X k X 1j X 2j... X ij... X kj X 1n1 X 2n2... X ini... X 1 X 2... X i... X kni X k X Analyse

123 Test d hypothèse Conditions d application. résidus indépendants, distribués selon une loi normale N (0; σ) (σ = Cte) homogénéité des variances (homoscédasticité) A vérifier avant le test d hypothèse! - normalité : droite de Henry, test d ajustement à une loi normale (e.g. Shapiro-Wilks), tests généraux d adéquation (Kolmogorov-Smirnov, Anderson-Darling,...) - homoscédasticité : tests de Cochran, Bartlett, Hartley, Levene Remarque. Modèle I robuste aux déviations par rapport à normalité. Hypothèses. H 0 : µ 1 = µ 2 = µ 3 =... = µ k H 1 : µ 1 µ 2 ou µ 1 µ 3 ou µ 2 µ 3... Attention! H 0 stipule que toutes les moyennes sont égales, alors que H 1 sera acceptée si au moins une paire de moyennes diffère Analyse

124 Test d hypothèse Conditions d application. résidus indépendants, distribués selon une loi normale N (0; σ) (σ = Cte) homogénéité des variances (homoscédasticité) A vérifier avant le test d hypothèse! - normalité : droite de Henry, test d ajustement à une loi normale (e.g. Shapiro-Wilks), tests généraux d adéquation (Kolmogorov-Smirnov, Anderson-Darling,...) - homoscédasticité : tests de Cochran, Bartlett, Hartley, Levene Remarque. Modèle I robuste aux déviations par rapport à normalité. Hypothèses. H 0 : µ 1 = µ 2 = µ 3 =... = µ k H 1 : µ 1 µ 2 ou µ 1 µ 3 ou µ 2 µ 3... Attention! H 0 stipule que toutes les moyennes sont égales, alors que H 1 sera acceptée si au moins une paire de moyennes diffère Analyse

125 Test d hypothèse Conditions d application. résidus indépendants, distribués selon une loi normale N (0; σ) (σ = Cte) homogénéité des variances (homoscédasticité) A vérifier avant le test d hypothèse! - normalité : droite de Henry, test d ajustement à une loi normale (e.g. Shapiro-Wilks), tests généraux d adéquation (Kolmogorov-Smirnov, Anderson-Darling,...) - homoscédasticité : tests de Cochran, Bartlett, Hartley, Levene Remarque. Modèle I robuste aux déviations par rapport à normalité. Hypothèses. H 0 : µ 1 = µ 2 = µ 3 =... = µ k H 1 : µ 1 µ 2 ou µ 1 µ 3 ou µ 2 µ 3... Attention! H 0 stipule que toutes les moyennes sont égales, alors que H 1 sera acceptée si au moins une paire de moyennes diffère Analyse

126 Test d hypothèse Conditions d application. résidus indépendants, distribués selon une loi normale N (0; σ) (σ = Cte) homogénéité des variances (homoscédasticité) A vérifier avant le test d hypothèse! - normalité : droite de Henry, test d ajustement à une loi normale (e.g. Shapiro-Wilks), tests généraux d adéquation (Kolmogorov-Smirnov, Anderson-Darling,...) - homoscédasticité : tests de Cochran, Bartlett, Hartley, Levene Remarque. Modèle I robuste aux déviations par rapport à normalité. Hypothèses. H 0 : µ 1 = µ 2 = µ 3 =... = µ k H 1 : µ 1 µ 2 ou µ 1 µ 3 ou µ 2 µ 3... Attention! H 0 stipule que toutes les moyennes sont égales, alors que H 1 sera acceptée si au moins une paire de moyennes diffère Analyse

127 Test d hypothèse Conditions d application. résidus indépendants, distribués selon une loi normale N (0; σ) (σ = Cte) homogénéité des variances (homoscédasticité) A vérifier avant le test d hypothèse! - normalité : droite de Henry, test d ajustement à une loi normale (e.g. Shapiro-Wilks), tests généraux d adéquation (Kolmogorov-Smirnov, Anderson-Darling,...) - homoscédasticité : tests de Cochran, Bartlett, Hartley, Levene Remarque. Modèle I robuste aux déviations par rapport à normalité. Hypothèses. H 0 : µ 1 = µ 2 = µ 3 =... = µ k H 1 : µ 1 µ 2 ou µ 1 µ 3 ou µ 2 µ 3... Attention! H 0 stipule que toutes les moyennes sont égales, alors que H 1 sera acceptée si au moins une paire de moyennes diffère Analyse

128 Tableau d ANOVA Analyse. décomposition des sources de variabilité : V inter : variance dûe au facteur V intra : variance résiduelle Autre formulation : V totale = V inter + V intra (y ij ȳ) = (ȳ i ȳ) + (y ij ȳ i ) Analyse

129 Tableau d ANOVA Analyse. décomposition des sources de variabilité : V inter : variance dûe au facteur V intra : variance résiduelle Autre formulation : V totale = V inter + V intra (y ij ȳ) = (ȳ i ȳ) + (y ij ȳ i ) Analyse

130 - on travaillera préférentiellement avec les sommes des carrés (SC) et les ddl variance (estimée) = carré moyen (CM) = SC/ddl - tout est résumé dans le tableau d analyse de la variance : Variance SC dl CM F P Totale k P ni i=1 j=1 (X ij X ) 2 n-1 CMt=SCt/dl P Groupes k i=1 n i ( X i X ) 2 k-1 CMg=SCg/dl CMg/CMe P Erreur k P ni i=1 j=1 (X ij X i ) 2 n-k CMe=SCe/dl Analyse

131 - on travaillera préférentiellement avec les sommes des carrés (SC) et les ddl variance (estimée) = carré moyen (CM) = SC/ddl - tout est résumé dans le tableau d analyse de la variance : Variance SC dl CM F P Totale k P ni i=1 j=1 (X ij X ) 2 n-1 CMt=SCt/dl P Groupes k i=1 n i ( X i X ) 2 k-1 CMg=SCg/dl CMg/CMe P Erreur k P ni i=1 j=1 (X ij X i ) 2 n-k CMe=SCe/dl Analyse

132 Statistique de test Valeur de test. F obs = CMg CMe loi de Fisher Snedecor a (k 1, n k) dl Décision. rejet H 0 ssi F obs > F α,(ν1,ν 2) si rejet H 0, il faut étudier quelles sont les paires de moyennes significativement différentes comparaisons multiples Analyse

133 Comparaisons multiples différents types de comparaisons multiples : planifiées vs. non-planifiées idée = modifier la statistique du t ou ajuster seuil α car probabilité de commettre une erreur de type I augmente avec le nombre de comparaisons : 1 (1 α) m, avec m = k(k 1) 2 e.g. 5 comparaisons α = 0.40 plus de 15 tests de comparaisons multiples disponibles... Test de Bonferroni, LSD, Scheffé, Tukey, GT2, Student-Newman-Keuls, Duncan, Dunnett... Tukey < Newman-Keuls < Duncan (puissance) Analyse

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48 Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Classe de première L

Classe de première L Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

IBM SPSS Statistics Base 20

IBM SPSS Statistics Base 20 IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34 Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

Résumé du Cours de Statistique Descriptive. Yves Tillé

Résumé du Cours de Statistique Descriptive. Yves Tillé Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Application sur le Dispositif en Blocs Complètement Randomisés

Application sur le Dispositif en Blocs Complètement Randomisés Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Optimisation des ressources des produits automobile première

Optimisation des ressources des produits automobile première EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan 1 Objectifs Traitement statistique des données d enquête avec introduction à SPSS Gilbert Ritschard Département d économétrie, Université de Genève gilbert.ritschard@themes.unige.ch Bamako, 7-11 octobre

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand Service méthodes statistiques Institut National d Etudes Démographiques (Ined)

Plus en détail

Statistiques 0,14 0,11

Statistiques 0,14 0,11 Statistiques Rappels de vocabulaire : "Je suis pêcheur et je désire avoir des informations sur la taille des truites d'une rivière. Je décide de mesurer les truites obtenues au cours des trois dernières

Plus en détail

Validation probabiliste d un Système de Prévision d Ensemble

Validation probabiliste d un Système de Prévision d Ensemble Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Le chi carré. Le sommaire. Approche quantitative

Le chi carré. Le sommaire. Approche quantitative Approche quantitative Le chi carré Les objectifs pédagogiques Définir le test du chi carré Déterminer la nature des données propres au chi carré Savoir calculer le chi carré Savoir déterminer les fréquences

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application

Plus en détail

Quelques rappels concernant la méthode expérimentale

Quelques rappels concernant la méthode expérimentale Quelques rappels concernant la méthode expérimentale 1. La Méthode expérimentale : Définition. Une définition classique de la méthode expérimentale est qu elle «correspond à la méthode d investigation

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase

Plus en détail

Econométrie et applications

Econométrie et applications Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Le Modèle Linéaire par l exemple :

Le Modèle Linéaire par l exemple : Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités

Plus en détail

TD1 Signaux, énergie et puissance, signaux aléatoires

TD1 Signaux, énergie et puissance, signaux aléatoires TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Statistiques descriptives

Statistiques descriptives Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives

Plus en détail

L exclusion mutuelle distribuée

L exclusion mutuelle distribuée L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué

Plus en détail