UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire MATHS/STATS. 1 Généralités sur les tests statistiques 2

Dimension: px
Commencer à balayer dès la page:

Download "UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2"

Transcription

1 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests statistiques 2 2 Conformité à une loi de probabilité Le test du χ Le test de Kolmogorov-Smirnov Tests à un échantillon Comparaison d une fréquence Comparaison d une moyenne Comparaison d une variance Tests à plusieurs échantillons Comparaison entre deux fréquences Comparaison entre deux moyennes Distribution normale Distribution quelconque Comparaison entre deux variances Comparaison entre deux coefficients de corrélation Annexe Table de Kolmogorov-Smirnov Table de Mann-Whitney

2 1 Généralités sur les tests statistiques La formulation d hypothèses et l évaluation de leur validité sont une branche importante des statistiques inférentielles. Afin de pouvoir décider entre plusieurs hypothèses possibles, on met en avant une hypothèse particulière que l on appelle l hypothèse nulle (notée H 0 ). L hypothèse alternative est notée H 1. En général H 1 est le contraire de H 0 mais il arrive que l hypothèse H 1 soit plus restrictive. Par exemple, si l hypothèse H 0 est l hypothèse H 1 pourrait être H 0 : a = b H 1 : a b H 1 : a < b H 1 : a > b Le résultat d un test est «rejeter H 0 (en faveur de H 1 )» ou bien «ne pas rejeter H 0». On ne conclut jamais par «rejeter H 1» et encore moins par «accepter H 1». Risques d erreur On dispose d une information insuffisante et la prise de décision implique un double risque d erreur : on peut décider que H 0 est fausse alors qu elle est vraie. C est le risque de première espèce, noté α. on peut décider que H 0 est vraie alors qu elle est fausse. C est le risque de deuxième espèce, noté β. Le risque α intéresse l utilisateur du test : pour lui H 0 est acceptée ou rejetée au risque α. Il est courant de fixer α = 0.05, parfois on descend à α = Le risque β intéresse le concepteur du test : pour lui, 1 β représente la puissance du test. Méthode Certains tests sont dits paramétriques : ce sont ceux qui supposent que les variables de décision utilisées ont une loi connue et qui ont besoin de connaître ou d estimer les paramètres de cette loi. Les autres tests sont dits non-paramétriques : ils s appliquent même si on ne connaît pas la loi de distribution des valeurs observées. En effet, ces tests n utilisent pas les valeurs elles-mêmes mais leur rang parmi toutes les valeurs ordonnées. Les tests de Mann-Whitney, de Kruskal-Wallis ou de Kolmogorov-Smirnov sont des exemples de tests non-paramétriques. Les tests paramétriques procèdent tous de la même manière : on dispose d une variable de décision X qui suit une loi théorique P connue lorsque l hypothèse H 0 est vraie. On détermine, grâce à cette loi théorique, une zone de rejet de probabilité α qui délimite les valeurs acceptables que peut prendre X. Si la valeur calculée pour la variable X se trouve dans la zone de rejet, on rejettera l hypothèse H 0 (avec un risque α de le faire à tort). 2

3 Cette zone est en deux parties pour un test bilatéral ou en une seule pour un test unilatéral. Tout dépend de la manière dont on a formulé l hypothèse alternative H 1. Par exemple, si on teste les effets d un vaccin avec l hypothèse H 0 : le vaccin n a pas d effet, on ne se contente pas en général d une hypothèse H 1 qui dirait le vaccin a de l effet car on souhaitera, en plus, que cet effet ne soit pas négatif et donc on exigera que la zone de rejet soit en un seul morceau. Échantillons On distingue deux types de tests : comparaison d une valeur observée et d une valeur théorique C est un test de conformité : l hypothèse H 0 suppose que les différences observées sont faibles et s expliquent par les hasards du tirage au sort. comparaison entre deux échantillons C est un test d homogénéïté : l hypothèse H 0 suppose que les échantillons proviennent d une même population et que les différences observées s expliquent par les fluctuations résultant de l échantillonage. Notion de p-valeur Les logiciels de calcul statistique expriment souvent le résultat d un test en fournissant une grandeur appelée p-valeur (en anglais p-value). Prenons l exemple d un test unilatéral. La zone de rejet est délimitée par la valeur u α telle que α = P (X u α ) Si on appelle x c la valeur calculée à partir des données de l échantillon du test pour la variable de décision X, on définit la p-valeur comme étant la probabilité que X x c, autrement dit p-value = P (X x c ) Si x c > u α, on voit à partir des deux définitions précédentes que p-value < α. Autrement dit, la règle de décision, en termes de p-valeur, stipule qu on rejette l hypothèse nulle H 0 dès que la p-valeur est inférieure au risque α choisi. On remarque que la p-valeur dépend des données de l échantillon testé (puisqu elle dépend de x c ) : exprimer le résultat du test au moyen de cette valeur permet de fournir une réponse indépendante du risque α et de conclure simplement en comparant ce risque à la p-valeur obtenue. La même p-valeur permet de conclure pour diverses valeurs de risques. 3

4 2 Conformité à une loi de probabilité 2.1 Le test du χ 2 C est un test permettant de comparer une loi de probabilité théorique avec une distribution expérimentale. L hypothèse nulle est : H 0 : il y a conformité de la distribution observée avec la distribution théorique Les données sont partitionnées en k classes. On appelle O i les effectifs observés pour chaque classe d événements, et C i les effectifs calculés. Sous cette hypothèse H 0, on montre que la variable aléatoire Y définie par Y = k (O i C i ) 2 i=1 suit une loi du χ 2 à ν = k 1 p degrés de liberté où p est le nombre de paramètres qu il faut estimer pour connaître la loi théorique. Pour que ce test soit valide, il faut que C i 5 pour tout i. On cherche, dans la table du χ 2, la valeur u α telle que P (Y u α ) = α, autrement dit P (Y u α ) = 1 α, c est-à-dire F (u α ) = 1 α si F est la fonction de répartition. Avec le logiciel R, on déterminerait u α au moyen de la fonction qchisq (qui est la fonction réciproque de la fonction de répartition), comme ceci (où n désigne le nombre de degrés de liberté) : > qchisq(0.95,n) La fonction chisq.test de R implémente le test du χ 2. L exemple qui suit en donne une illustration. Exemple On lance un dé 60 fois et on obtient les résultats suivants : C i Faces Effectifs Peut-on rejeter l hypothèse que le dé est truqué? Avec R, on exécute les deux instructions suivantes : > obs<-c(14, 7, 5, 11, 7, 16) > chisq.test(obs) Chi-squared test for given probabilities data: obs X-squared = 11.6, df = 5, p-value = Le problème a 5 degrés de liberté (df, degrees of freedom). La valeur calculée x c de la variable de décision est La p-valeur renvoyée par le test est On peut retrouver cette valeur directement à partir de la valeur calculée x c au moyen de la fonction de répartition pchisq : > 1-pchisq(11.6,5) 4

5 [1] On rejette l hypothèse H 0 (avec un risque 0.05 de le faire à tort) car < Une autre manière de le voir est de calculer la borne u α de la zone de rejet au moyen de la fonction quantile qchisq (réciproque de la fonction de répartition) : > qchisq(0.95,5) [1] On rejette l hypothèse H 0 car 11.6 > Le test de Kolmogorov-Smirnov Le test de Kolmogorov-Smirnov est aussi un test d ajustement mais il est fondé sur les fonctions de répartition. L hypothèse nulle est : H 0 : la loi P a la même fonction de répartition F qu une loi continue donnée L idée est que si l hypothèse nulle H 0 est correcte, la fonction de répartition empirique F de l échantillon doit être proche de F. La fonction de répartition empirique est définie par : F = 0 pour x < X 1 i n pour X i x < X i+1 1 pour x X n où les X i représentent les valeurs de l échantillon classées par ordre croissant (appellées traditionnellement des statistiques d ordre). F s interprète comme la proportion d éléments de l échantillon qui sont inférieurs ou égaux à x. On mesure l adéquation de la fonction F à la fonction F au moyen d une distance particulière dite de Kolmogorov-Smirnov, qui est la distance de la norme uniforme entre fonctions de répartition. Graphiquement, c est le plus grand écart vertical en valeur absolue entre la valeur empirique et la valeur théorique. Pour obtenir cette distance, on calcule la différence entre F et F aux points X i et on cherche le maximum selon la formule : D KS (F, F ) = max i=1,...,n { F (Xi ) i n, F (X i ) i 1 n } Sous l hypothèse H 0, la loi de la variable de décision D KS (F, F ) ne dépend pas de F. On compare la valeur obtenue à une valeur critique D α (n) fournie par les tables de Kolmogorov-Smirnov (voir table 1 p. 15). Le test est unilatéral. Si D KS > D α (n), on rejette l hypothèse H 0 avec un risque α de se tromper. 5

6 3 Tests à un échantillon Cette section passe en revue les tests usuels appliqués lorsqu on compare une valeur observée dans un échantillon avec une valeur théorique. On verra successivement les cas d une fréquence, d une moyenne et d une variance. 3.1 Comparaison d une fréquence On étudie un caractère statistique dans une population : on appelle p la fréquence de ce caractère dans la population et f la fréquence observée dans un échantillon de taille n. Appelons F la variable aléatoire qui prend la valeur f pour chaque échantillon de taille n testé. En principe F suit une loi binômiale B(n, p). L hypothèse nulle est : H 0 : la fréquence observée f est conforme à la fréquence théorique p Sous l hypothèse H 0, on montre que la variable de décision U définie par U = F p p(1 p) suit approximativement une loi normale centrée réduite N (0, 1). Dans le cas d un test bilatéral, on détermine les bornes u α et u α délimitant les deux morceaux de la zone de rejet, avec l équation : n P (U u α ) = 1 α 2 autrement dit, avec la fonction quantile Q : u α = Q(1 α 2 ) Si α est fixé à 0.05, on trouve avec R la valeur suivante pour u α : > qnorm(0.975) [1] C est une valeur qui est couramment arrondie à Dans le cas d un test unilatéral, il y a une borne u α seulement, définie par : c est-à-dire P (U u α ) = 1 α u α = Q(1 α) Si α est fixé à 0.05, on trouve cette fois la valeur suivante pour u α : > qnorm(0.95) [1]

7 3.2 Comparaison d une moyenne On considère une variable aléatoire quantitative X définie sur une population. Elle a pour moyenne E(X) = µ et pour variance V (X) = σ 2. Si on observe un échantillon de taille n, on se demande si la moyenne x de l échantillon est en accord avec l espérance µ. L hypothèse nulle est : H 0 : la moyenne x de l échantillon est conforme à l espérance µ Cas d un grand échantillon C est le cas où n > 30. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = X µ s/ n suit approximativement une loi normale centrée réduite N (0, 1). Le calcul des bornes de la zone de rejet se fait donc comme au paragraphe précédent. Cas d un petit échantillon On suppose que ce petit échantillon fait partie d une population qui est gaussienne dans son ensemble. On doit distinguer deux cas : si l écart-type σ est connu, on montre que la variable de décision U définie par U = X µ σ/ n suit approximativement une loi normale centrée réduite N (0, 1). On utilise alors la même méthode qu avec un grand échantillon. si l écart-type σ n est pas connu, on doit utiliser l écart estimé s de l échantillon. Sous l hypothèse H 0, on montre que la variable de décision T définie par T = X µ s/ n suit une loi de Student à n 1 degrés de liberté (n étant la taille de l échantillon). Dans ce dernier cas, la valeur de u α, pour un test bilatéral, est toujours définie par la relation u α = Q(1 α 2 ) mais il faut cette fois lire dans une table de la loi de Student. Si α est fixé à 0.05, on trouvera cette valeur avec R au moyen de l instruction suivante (où df désigne le nombre de degrés de liberté) : > qt(0.975,df) Par exemple : > qt(0.975,7) [1] La lettre t est le nom de la loi de Student dans R : la fonction qt est donc la fonction quantile de cette loi. 7

8 3.3 Comparaison d une variance La situation est la même qu au paragraphe précédent mais c est la dispersion des données, mesurée par la variance, que l on cherche à tester. La variance estimée de l échantillon est s 2 et on appelle S la variable aléatoire qui prend la valeur s pour chaque échantillon observé de taille n. Rappel : la variance estimée s 2 d un échantillon de taille k est calculée par l estimateur sans biais s 2 = 1 n 1 k n i (x i x) 2 = i=1 n n 1 σ2 L hypothèse nulle est : H 0 : la variance estimée s 2 est conforme à la variance σ 2 de la population Sous l hypothèse H 0, on montre que la variable de décision Y définie par Y = n 1 σ 2 S 2 suit une loi du χ 2 à n 1 degrés de liberté. Le calcul des bornes a et b de la zone de rejet se fait au moyen des relations suivantes : P (Y a) = α et P (Y b) = α 2 2 Si la valeur calculée y de la variable de décision Y est dans l intervalle ]a, b[, on ne peut pas rejeter l hypothèse nulle H 0. Si y / ]a, b[, on rejette H 0 au risque α de se tromper. Par exemple, avec un risque de 0.05 et 9 degrés de liberté, R permet de déterminer les valeurs de a et b comme ceci : > a=qchisq(0.025,9) > a [1] > b=qchisq(0.975,9) > b [1] Le nom de la loi du χ 2 dans R est chisq : la fonction qchisq est donc la fonction quantile de cette loi. 4 Tests à plusieurs échantillons Dans deux populations P 1 et P 2, on étudie un caractère ou une grandeur quantitative. Si on extrait des échantillons E 1 et E 2 de tailles respectives n 1 et n 2, on se pose la question de savoir si les différences entre les valeurs estimées sur ces deux échantillons sont significatives ou, au contraire, explicables par les hasards du tirage au sort. Les sections qui suivent passent en revue successivement le cas des fréquences, des moyennes, des variances et des coefficients de corrélation. 8

9 4.1 Comparaison entre deux fréquences Un caractère à deux modalités (de type vrai/faux par exemple) est étudié dans les deux populations. Si le caractère apparaît respectivement k 1 et k 2 fois, les fréquences observées sont f 1 = k 1 n 1 et f 2 = k 2 n 2. On note F 1 et F 2 les variables aléatoires qui prennent les valeurs f 1 et f 2 sur chaque échantillon de taille n 1 et n 2. Ces variables F 1 et F 2 suivent en principe des lois binômiales. L hypothèse nulle est : H 0 : la différence entre f 1 et f 2 n est pas significative. On va supposer que les deux échantillons ont des caractéristiques qui permettent d approximer les lois binômiales par des lois normales. On suppose donc que : n 1 30, n 1 f 1 5, n 1 (1 f 1 ) 5 (1) n 2 30, n 2 f 2 5, n 2 (2 f 2 ) 5 (2) Dans ces conditions, sous l hypothèse H 0, on montre que la variable de décision Y définie par F 1 F 2 U = p1 (1 p 1 ) + p 2(1 p 2 ) n 1 n 2 suit une loi normale centrée réduite N (0, 1). Sous l hypothèse H 0, on réunit les deux échantillons et on estime p par la fréquence observée sur la réunion : ˆp = k 1 + k 2 n 1 + n 2 = n 1f 1 + n 2 f 2 n 1 + n 2 et on remplace p 1 et p 2 par ˆp dans le calcul de la variable U, autrement dit : f 1 f 2 U = ( 1 ˆp(1 ˆp) + 1 ) n 1 n Comparaison entre deux moyennes On étudie une variable aléatoire X dans deux populations P 1 et P 2. La moyenne et la variance de X sont µ 1 et σ 2 1 dans P 1, µ 2 et σ 2 2 dans P 2. Dans tout ce qui suit, on fait l hypothèse que les échantillons sont indépendants (il existe des tests pour les échantillons appariés mais on ne les traitera pas ici) Distribution normale On suppose dans ce paragraphe que la variable étudiée est distribuée selon une loi normale dans la population. L hypothèse nulle est : H 0 : µ 1 = µ 2, ou la différence entre x 1 et x 2 n est pas significative 9

10 Cas d un grand échantillon C est le cas où n 1 > 30 et n 2 > 30. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = X 1 X 2 σ1 2 + σ2 2 n 1 n 2 suit approximativement une loi normale centrée réduite N (0, 1). Les échantillons étant de grande taille, le même résultat reste valable si σ 2 1 et σ 2 2 ne sont pas connues et qu on les remplace par les variances estimées s 2 1 et s 2 2. Cas d un petit échantillon Si les échantillons sont extraits de populations gaussiennes et si σ1 2 et σ2 2 ont une même valeur σ 2 alors, sous l hypothèse H 0, on montre que la variable de décision T définie par T = X 1 X 2 σ 2 ( 1n1 + 1n2 ) suit une loi de Student à n 1 + n 2 2 degrés de liberté. Si σ 2 n est pas connu, on l estime au moyen de la formule : Distribution quelconque S 2 = (n 1 1)s (n 2 1)s 2 2 n 1 + n 2 2 Lorsque la variable étudiée n est pas distribuée normalement dans la population, on doit utiliser un test non paramétrique : dans le cas de 2 échantillons, on applique le test de Mann-Whitney et dans le cas de k échantillons ((k > 2) le test de Kruskal-Wallis. Ces deux tests ne font pas d estimation de la moyenne ou de la variance et ne prennent en compte que le rang des valeurs observées et non pas les valeurs ellesmêmes. Test de Mann-Whitney On considère deux échantillons, E 1 et E 2, d observations de la variable étudiée, de tailles respectives n 1 et n 2. On forme la réunion de ces deux échantillons et on l ordonne par ordre croissant. Pour chaque valeur x i de l échantillon E 1, on compte le nombre n xi de valeurs provenant de l échantillon E 2 qui sont supérieures à x i. On note u 1 la somme des n xi. On fait ensuite le même calcul à partir de l échantillon E 2 : pour chaque valeur y j de l échantillon E 2, n yj est le nombre de valeurs provenant de l échantillon E 1 qui sont supérieures à y j. On note u 2 la somme des n yj. La variable de décision est u = min(u 1, u 2 ) Si les échantillons sont petits, on lit la valeur critique c α correspondant au seuil α choisi dans des tables de Mann-Whitney (voir la table 2 p. 16). Si u est inférieure à c α, on rejette l hypothèse H 0 au risque α de se tromper. 10

11 Si les échantillons sont de taille supérieure à 20, la variable u suit approximativement une loi normale de moyenne et d écart-type µ = n 1n 2 n1 n 2 (n 1 + n 2 + 1) σ = 2 12 On cherche dans ce cas les valeurs critiques pour la loi N (µ, σ). Remarque : lorsque des valeurs sont identiques (ex-aequos), leur rang est remplacé par la moyenne des rangs correspondants : par exemple, si la 6ème et la 7ème valeur sont identiques, on considère que cette valeur correspond au rang 6,5. Test de Kruskal-Wallis La démarche est analogue à celle du test de Mann-Whitney. On considère k échantillons E 1,..., E k, d observations de la variable étudiée, de tailles respectives n 1,..., n k. On forme la réunion des k échantillons et on l ordonne par ordre croissant. Pour chaque échantillon E i, on calcule la somme r i des rangs occupés par les observations qui proviennent de lui. La variable de décision est : h = ( k ) 12 ri 2 3(N + 1) N(N + 1) n i=1 i avec N = k i=1 n i. Si les tailles n i sont supérieures à 5, la variable h suit (sous l hypothèse H 0 ) une loi du χ 2 à k 1 degrés de liberté. Sinon, il faut lire la valeur critique dans des tables de Kruskal-Wallis. Lorsque h h α, on rejette l hypothèse H 0. Remarque : lorsque k = 2, on retrouve le test de Mann-Whitney. Les quantités u 1 et u 2 de Mann-Whitney et les quantités r 1 et r 2 de Kruskal-Wallis sont reliées par les relations : r i = u i + n i(n i + 1) i = 1, Comparaison entre deux variances Avec les mêmes notations que dans le paragraphe précédent, on estime la variance des échantillons au moyen de s 2 1 et s 2 2. La question est de savoir si la différence entre s 2 1 et s 2 2 est significative ou simplement due aux fluctuations d échantillonnage. On note S 1 et S 2 les variables aléatoires qui prennent les valeurs s 1 et s 2 sur tous les échantillons de taille n 1 et n 2 respectivement. L hypothèse nulle est : H 0 : σ 2 1 = σ 2 2 Sous l hypothèse H 0 et si les deux populations P 1 et P 2 sont gaussiennes, on montre que la variable de décision F définie par F = S2 1 S 2 2 suit une loi de Fisher-Snedecor de paramètres (n 1 1, n 2 1). 11

12 Une loi de Fisher-Snedecor (appelée aussi loi du F ) possède deux paramètres ν 1 et ν 2 dits degrés de liberté. Les tables donnant les valeurs de ces lois sont à double entrée. Chaque table correspond à une valeur particulière du risque α. L ordre des paramètres ν 1 et ν 2 est important : les tables ne sont pas symétriques. On a la propriété suivante : si une variable aléatoire F suit une loi de Fisher-Snedecor à ν 1 et ν 2 degrés de liberté, alors 1 F suit une loi de Fisher-Snedecor à ν 2 et ν 1 degrés de liberté. Le calcul des bornes de la zone de rejet consiste à trouver deux nombres a et b tels que : P (F a) = α et P (F b) = α 2 2 Les tables pour une valeur r du risque donnent habituellement la borne u telle que P (F u) = r. On a donc besoin en principe des tables pour et si on veut α = Souvent, seule la valeur de b est calculée : en effet, les valeurs données dans les tables sont toujours supérieures à 1. Il suffit donc de s arranger pour ordonner les deux échantillons de telle sorte que s 2 1 > s 2 2 et la règle de décision est simplement : si s2 1 s 2 < b, on ne peut pas rejeter l hypothèse nulle H 0 ; 2 si s2 1 s 2 b, on rejette l hypothèse nulle H 0 avec un risque α de se tromper. 2 Mais il faut comprendre que cela signifie qu on opte pour un test unilatéral, autrement dit qu on postule que l hypothèse alternative est : H 1 : σ1 2 > σ2 2 Plutôt que de dépendre de l existence de tables appropriées, il est préférable d utiliser R pour calculer les bornes a et b. Dans R, la loi de Fisher-Snedecor est désignée par la lettre f. La fonction quantile se note donc qf et la fonction de répartition pf. Ces deux fonctions prennent en argument les deux degrés de liberté. Par exemple, au risque α = 0.05 avec des degrés de liberté ν 1 = 8 et ν 2 = 5 on trouve : > a=qf(0.025,8,5) > a [1] > b=qf(0.975,8,5) > b [1] Il existe aussi dans R une fonction var.test qui exécute directement le test de comparaison des variances de deux échantillons. Cette fonction possède un paramètre optionnel alternative qui permet de spécifier si on veut un test bilatéral ou unilatéral. Les valeurs possibles pour cette option sont : "two.sided", "less", "greater". Par défaut, c est un test bilatéral (two.sided) qui est exécuté. Exemple Un chimiste a effectué des dosages. Deux prélèvements ont été effectués et des mesures de concentration ont donné les résultats suivants : 12

13 Prélèvement 1 5,9 5,7 5,4 6,2 Prélèvement 2 5,7 5,9 4,5 6,1 4,6 Comparer la variabilité des erreurs entre les deux échantillons. On peut faire le calcul direct avec R comme ceci : > p1 <- c(5.9, 5.7, 5.4, 6.2) > p2 <- c(5.7, 5.9, 4.5, 6.1, 4.6) > var1 <- var(p1) [1] > var2 <- var(p2) [1] > F <- var1/var2 [1] La valeur critique à 5% est : > qf(0.95,3,4) [1] Puisque < , on accepte l hypothèse H 0. En faisant exécuter le test au moyen de la fonction var.test, on obtient : > var.test(p1,p2) F test to compare two variances data: p1 and p2 F = , num df = 3, denom df = 4, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances La p-valeur est supérieure au risque 0.05, ce qui conduit bien à accepter l hypothèse H 0. On retrouve directement la p-valeur comme ceci : > pf(f,3,4)*2 [1]

14 4.4 Comparaison entre deux coefficients de corrélation Le contexte est celui de deux populations P 1 et P 2 sur lesquelles on considère des couples de variables aléatoires (X 1, Y 1 ) et (X 2, Y 2 ) qui suivent une loi normale à deux dimensions. La liaison entre les variables X 1 et Y 1 dans la population P 1 est mesurée par un coefficient de corrélation (inconnu) ρ 1. De même, dans la population P 2, la corrélation est mesurée par ρ 2. On obtient des estimations r 1 et r 2 de ρ 1 et ρ 2 à partir d échantillons de tailles n 1 et n 2 respectivement. L hypothèse nulle est : H 0 : ρ 1 = ρ 2 autrement dit la différence entre r 1 et r 2 n est pas significative. Pour formuler plus facilement le test, on introduit les notations suivantes : z 1 = 1 ( log r1 ) et z 2 = 1 ( r 1 2 log r2 ) 1 r 2 et on note Z 1 et Z 2 les variables aléatoires associées. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = Z 1 Z 2 1 n n 2 3 suit approximativement une loi normale centrée réduite N (0, 1) dès que n 1 et n 2 sont suffisamment grands ( 20). 14

15 5 Annexe 5.1 Table de Kolmogorov-Smirnov Seuils critiques D α (n) n α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = > / n 1.14/ n 1.22/ n 1.36/ n 1.63/ n TABLE 1 Table de Kolmogorov-Smirnov 15

16 5.2 Table de Mann-Whitney TABLE 2 Table de Mann-Whitney au seuil 5% 16

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

TESTS D'HYPOTHESES Etude d'un exemple

TESTS D'HYPOTHESES Etude d'un exemple TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Package TestsFaciles

Package TestsFaciles Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

IFT3245. Simulation et modèles

IFT3245. Simulation et modèles IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. . MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION

Plus en détail

Apprentissage par renforcement (1a/3)

Apprentissage par renforcement (1a/3) Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

Épreuve collaborative

Épreuve collaborative Épreuve collaborative Pour chaque partie, la grille permet d apprécier, selon quatre niveaux, les compétences développées dans le sujet par le candidat. Pour cela, elle s appuie sur des indicateurs traduisant

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16 ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Probabilités Loi binomiale Exercices corrigés

Probabilités Loi binomiale Exercices corrigés Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités

Plus en détail

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S FICHE Fiche à destination des enseignants TS 35 Numériser Type d'activité Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S Compétences

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail

Exposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez.

Exposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez. Test d homogéné$é Y. BRUNET-MORET Ingénieur hydrologue, Bureau Central Hydrologique Paris RÉSUMÉ Présentation d un test d homogénéi.té spécialement conçu pour vérijier Z homogénéité des suites chronologiques

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Classe de première L

Classe de première L Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous

Plus en détail

Arrondissage des résultats de mesure. Nombre de chiffres significatifs

Arrondissage des résultats de mesure. Nombre de chiffres significatifs BUREAU NATIONAL DE MÉTROLOGIE COMMISSARIAT À L'ÉNERGIE ATOMIQUE LABORATOIRE NATIONAL HENRI BECQUEREL Note technique LNHB/04-13 Arrondissage des résultats de esure Nobre de chiffres significatifs M.M. Bé,

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Mesures et incertitudes

Mesures et incertitudes En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire

Plus en détail

Mario Geiger octobre 08 ÉVAPORATION SOUS VIDE

Mario Geiger octobre 08 ÉVAPORATION SOUS VIDE ÉVAPORATION SOUS VIDE 1 I SOMMAIRE I Sommaire... 2 II Évaporation sous vide... 3 III Description de l installation... 5 IV Travail pratique... 6 But du travail... 6 Principe... 6 Matériel... 6 Méthodes...

Plus en détail

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,

Plus en détail