UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire MATHS/STATS. 1 Généralités sur les tests statistiques 2
|
|
- Sévérine Paul
- il y a 8 ans
- Total affichages :
Transcription
1 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests statistiques 2 2 Conformité à une loi de probabilité Le test du χ Le test de Kolmogorov-Smirnov Tests à un échantillon Comparaison d une fréquence Comparaison d une moyenne Comparaison d une variance Tests à plusieurs échantillons Comparaison entre deux fréquences Comparaison entre deux moyennes Distribution normale Distribution quelconque Comparaison entre deux variances Comparaison entre deux coefficients de corrélation Annexe Table de Kolmogorov-Smirnov Table de Mann-Whitney
2 1 Généralités sur les tests statistiques La formulation d hypothèses et l évaluation de leur validité sont une branche importante des statistiques inférentielles. Afin de pouvoir décider entre plusieurs hypothèses possibles, on met en avant une hypothèse particulière que l on appelle l hypothèse nulle (notée H 0 ). L hypothèse alternative est notée H 1. En général H 1 est le contraire de H 0 mais il arrive que l hypothèse H 1 soit plus restrictive. Par exemple, si l hypothèse H 0 est l hypothèse H 1 pourrait être H 0 : a = b H 1 : a b H 1 : a < b H 1 : a > b Le résultat d un test est «rejeter H 0 (en faveur de H 1 )» ou bien «ne pas rejeter H 0». On ne conclut jamais par «rejeter H 1» et encore moins par «accepter H 1». Risques d erreur On dispose d une information insuffisante et la prise de décision implique un double risque d erreur : on peut décider que H 0 est fausse alors qu elle est vraie. C est le risque de première espèce, noté α. on peut décider que H 0 est vraie alors qu elle est fausse. C est le risque de deuxième espèce, noté β. Le risque α intéresse l utilisateur du test : pour lui H 0 est acceptée ou rejetée au risque α. Il est courant de fixer α = 0.05, parfois on descend à α = Le risque β intéresse le concepteur du test : pour lui, 1 β représente la puissance du test. Méthode Certains tests sont dits paramétriques : ce sont ceux qui supposent que les variables de décision utilisées ont une loi connue et qui ont besoin de connaître ou d estimer les paramètres de cette loi. Les autres tests sont dits non-paramétriques : ils s appliquent même si on ne connaît pas la loi de distribution des valeurs observées. En effet, ces tests n utilisent pas les valeurs elles-mêmes mais leur rang parmi toutes les valeurs ordonnées. Les tests de Mann-Whitney, de Kruskal-Wallis ou de Kolmogorov-Smirnov sont des exemples de tests non-paramétriques. Les tests paramétriques procèdent tous de la même manière : on dispose d une variable de décision X qui suit une loi théorique P connue lorsque l hypothèse H 0 est vraie. On détermine, grâce à cette loi théorique, une zone de rejet de probabilité α qui délimite les valeurs acceptables que peut prendre X. Si la valeur calculée pour la variable X se trouve dans la zone de rejet, on rejettera l hypothèse H 0 (avec un risque α de le faire à tort). 2
3 Cette zone est en deux parties pour un test bilatéral ou en une seule pour un test unilatéral. Tout dépend de la manière dont on a formulé l hypothèse alternative H 1. Par exemple, si on teste les effets d un vaccin avec l hypothèse H 0 : le vaccin n a pas d effet, on ne se contente pas en général d une hypothèse H 1 qui dirait le vaccin a de l effet car on souhaitera, en plus, que cet effet ne soit pas négatif et donc on exigera que la zone de rejet soit en un seul morceau. Échantillons On distingue deux types de tests : comparaison d une valeur observée et d une valeur théorique C est un test de conformité : l hypothèse H 0 suppose que les différences observées sont faibles et s expliquent par les hasards du tirage au sort. comparaison entre deux échantillons C est un test d homogénéïté : l hypothèse H 0 suppose que les échantillons proviennent d une même population et que les différences observées s expliquent par les fluctuations résultant de l échantillonage. Notion de p-valeur Les logiciels de calcul statistique expriment souvent le résultat d un test en fournissant une grandeur appelée p-valeur (en anglais p-value). Prenons l exemple d un test unilatéral. La zone de rejet est délimitée par la valeur u α telle que α = P (X u α ) Si on appelle x c la valeur calculée à partir des données de l échantillon du test pour la variable de décision X, on définit la p-valeur comme étant la probabilité que X x c, autrement dit p-value = P (X x c ) Si x c > u α, on voit à partir des deux définitions précédentes que p-value < α. Autrement dit, la règle de décision, en termes de p-valeur, stipule qu on rejette l hypothèse nulle H 0 dès que la p-valeur est inférieure au risque α choisi. On remarque que la p-valeur dépend des données de l échantillon testé (puisqu elle dépend de x c ) : exprimer le résultat du test au moyen de cette valeur permet de fournir une réponse indépendante du risque α et de conclure simplement en comparant ce risque à la p-valeur obtenue. La même p-valeur permet de conclure pour diverses valeurs de risques. 3
4 2 Conformité à une loi de probabilité 2.1 Le test du χ 2 C est un test permettant de comparer une loi de probabilité théorique avec une distribution expérimentale. L hypothèse nulle est : H 0 : il y a conformité de la distribution observée avec la distribution théorique Les données sont partitionnées en k classes. On appelle O i les effectifs observés pour chaque classe d événements, et C i les effectifs calculés. Sous cette hypothèse H 0, on montre que la variable aléatoire Y définie par Y = k (O i C i ) 2 i=1 suit une loi du χ 2 à ν = k 1 p degrés de liberté où p est le nombre de paramètres qu il faut estimer pour connaître la loi théorique. Pour que ce test soit valide, il faut que C i 5 pour tout i. On cherche, dans la table du χ 2, la valeur u α telle que P (Y u α ) = α, autrement dit P (Y u α ) = 1 α, c est-à-dire F (u α ) = 1 α si F est la fonction de répartition. Avec le logiciel R, on déterminerait u α au moyen de la fonction qchisq (qui est la fonction réciproque de la fonction de répartition), comme ceci (où n désigne le nombre de degrés de liberté) : > qchisq(0.95,n) La fonction chisq.test de R implémente le test du χ 2. L exemple qui suit en donne une illustration. Exemple On lance un dé 60 fois et on obtient les résultats suivants : C i Faces Effectifs Peut-on rejeter l hypothèse que le dé est truqué? Avec R, on exécute les deux instructions suivantes : > obs<-c(14, 7, 5, 11, 7, 16) > chisq.test(obs) Chi-squared test for given probabilities data: obs X-squared = 11.6, df = 5, p-value = Le problème a 5 degrés de liberté (df, degrees of freedom). La valeur calculée x c de la variable de décision est La p-valeur renvoyée par le test est On peut retrouver cette valeur directement à partir de la valeur calculée x c au moyen de la fonction de répartition pchisq : > 1-pchisq(11.6,5) 4
5 [1] On rejette l hypothèse H 0 (avec un risque 0.05 de le faire à tort) car < Une autre manière de le voir est de calculer la borne u α de la zone de rejet au moyen de la fonction quantile qchisq (réciproque de la fonction de répartition) : > qchisq(0.95,5) [1] On rejette l hypothèse H 0 car 11.6 > Le test de Kolmogorov-Smirnov Le test de Kolmogorov-Smirnov est aussi un test d ajustement mais il est fondé sur les fonctions de répartition. L hypothèse nulle est : H 0 : la loi P a la même fonction de répartition F qu une loi continue donnée L idée est que si l hypothèse nulle H 0 est correcte, la fonction de répartition empirique F de l échantillon doit être proche de F. La fonction de répartition empirique est définie par : F = 0 pour x < X 1 i n pour X i x < X i+1 1 pour x X n où les X i représentent les valeurs de l échantillon classées par ordre croissant (appellées traditionnellement des statistiques d ordre). F s interprète comme la proportion d éléments de l échantillon qui sont inférieurs ou égaux à x. On mesure l adéquation de la fonction F à la fonction F au moyen d une distance particulière dite de Kolmogorov-Smirnov, qui est la distance de la norme uniforme entre fonctions de répartition. Graphiquement, c est le plus grand écart vertical en valeur absolue entre la valeur empirique et la valeur théorique. Pour obtenir cette distance, on calcule la différence entre F et F aux points X i et on cherche le maximum selon la formule : D KS (F, F ) = max i=1,...,n { F (Xi ) i n, F (X i ) i 1 n } Sous l hypothèse H 0, la loi de la variable de décision D KS (F, F ) ne dépend pas de F. On compare la valeur obtenue à une valeur critique D α (n) fournie par les tables de Kolmogorov-Smirnov (voir table 1 p. 15). Le test est unilatéral. Si D KS > D α (n), on rejette l hypothèse H 0 avec un risque α de se tromper. 5
6 3 Tests à un échantillon Cette section passe en revue les tests usuels appliqués lorsqu on compare une valeur observée dans un échantillon avec une valeur théorique. On verra successivement les cas d une fréquence, d une moyenne et d une variance. 3.1 Comparaison d une fréquence On étudie un caractère statistique dans une population : on appelle p la fréquence de ce caractère dans la population et f la fréquence observée dans un échantillon de taille n. Appelons F la variable aléatoire qui prend la valeur f pour chaque échantillon de taille n testé. En principe F suit une loi binômiale B(n, p). L hypothèse nulle est : H 0 : la fréquence observée f est conforme à la fréquence théorique p Sous l hypothèse H 0, on montre que la variable de décision U définie par U = F p p(1 p) suit approximativement une loi normale centrée réduite N (0, 1). Dans le cas d un test bilatéral, on détermine les bornes u α et u α délimitant les deux morceaux de la zone de rejet, avec l équation : n P (U u α ) = 1 α 2 autrement dit, avec la fonction quantile Q : u α = Q(1 α 2 ) Si α est fixé à 0.05, on trouve avec R la valeur suivante pour u α : > qnorm(0.975) [1] C est une valeur qui est couramment arrondie à Dans le cas d un test unilatéral, il y a une borne u α seulement, définie par : c est-à-dire P (U u α ) = 1 α u α = Q(1 α) Si α est fixé à 0.05, on trouve cette fois la valeur suivante pour u α : > qnorm(0.95) [1]
7 3.2 Comparaison d une moyenne On considère une variable aléatoire quantitative X définie sur une population. Elle a pour moyenne E(X) = µ et pour variance V (X) = σ 2. Si on observe un échantillon de taille n, on se demande si la moyenne x de l échantillon est en accord avec l espérance µ. L hypothèse nulle est : H 0 : la moyenne x de l échantillon est conforme à l espérance µ Cas d un grand échantillon C est le cas où n > 30. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = X µ s/ n suit approximativement une loi normale centrée réduite N (0, 1). Le calcul des bornes de la zone de rejet se fait donc comme au paragraphe précédent. Cas d un petit échantillon On suppose que ce petit échantillon fait partie d une population qui est gaussienne dans son ensemble. On doit distinguer deux cas : si l écart-type σ est connu, on montre que la variable de décision U définie par U = X µ σ/ n suit approximativement une loi normale centrée réduite N (0, 1). On utilise alors la même méthode qu avec un grand échantillon. si l écart-type σ n est pas connu, on doit utiliser l écart estimé s de l échantillon. Sous l hypothèse H 0, on montre que la variable de décision T définie par T = X µ s/ n suit une loi de Student à n 1 degrés de liberté (n étant la taille de l échantillon). Dans ce dernier cas, la valeur de u α, pour un test bilatéral, est toujours définie par la relation u α = Q(1 α 2 ) mais il faut cette fois lire dans une table de la loi de Student. Si α est fixé à 0.05, on trouvera cette valeur avec R au moyen de l instruction suivante (où df désigne le nombre de degrés de liberté) : > qt(0.975,df) Par exemple : > qt(0.975,7) [1] La lettre t est le nom de la loi de Student dans R : la fonction qt est donc la fonction quantile de cette loi. 7
8 3.3 Comparaison d une variance La situation est la même qu au paragraphe précédent mais c est la dispersion des données, mesurée par la variance, que l on cherche à tester. La variance estimée de l échantillon est s 2 et on appelle S la variable aléatoire qui prend la valeur s pour chaque échantillon observé de taille n. Rappel : la variance estimée s 2 d un échantillon de taille k est calculée par l estimateur sans biais s 2 = 1 n 1 k n i (x i x) 2 = i=1 n n 1 σ2 L hypothèse nulle est : H 0 : la variance estimée s 2 est conforme à la variance σ 2 de la population Sous l hypothèse H 0, on montre que la variable de décision Y définie par Y = n 1 σ 2 S 2 suit une loi du χ 2 à n 1 degrés de liberté. Le calcul des bornes a et b de la zone de rejet se fait au moyen des relations suivantes : P (Y a) = α et P (Y b) = α 2 2 Si la valeur calculée y de la variable de décision Y est dans l intervalle ]a, b[, on ne peut pas rejeter l hypothèse nulle H 0. Si y / ]a, b[, on rejette H 0 au risque α de se tromper. Par exemple, avec un risque de 0.05 et 9 degrés de liberté, R permet de déterminer les valeurs de a et b comme ceci : > a=qchisq(0.025,9) > a [1] > b=qchisq(0.975,9) > b [1] Le nom de la loi du χ 2 dans R est chisq : la fonction qchisq est donc la fonction quantile de cette loi. 4 Tests à plusieurs échantillons Dans deux populations P 1 et P 2, on étudie un caractère ou une grandeur quantitative. Si on extrait des échantillons E 1 et E 2 de tailles respectives n 1 et n 2, on se pose la question de savoir si les différences entre les valeurs estimées sur ces deux échantillons sont significatives ou, au contraire, explicables par les hasards du tirage au sort. Les sections qui suivent passent en revue successivement le cas des fréquences, des moyennes, des variances et des coefficients de corrélation. 8
9 4.1 Comparaison entre deux fréquences Un caractère à deux modalités (de type vrai/faux par exemple) est étudié dans les deux populations. Si le caractère apparaît respectivement k 1 et k 2 fois, les fréquences observées sont f 1 = k 1 n 1 et f 2 = k 2 n 2. On note F 1 et F 2 les variables aléatoires qui prennent les valeurs f 1 et f 2 sur chaque échantillon de taille n 1 et n 2. Ces variables F 1 et F 2 suivent en principe des lois binômiales. L hypothèse nulle est : H 0 : la différence entre f 1 et f 2 n est pas significative. On va supposer que les deux échantillons ont des caractéristiques qui permettent d approximer les lois binômiales par des lois normales. On suppose donc que : n 1 30, n 1 f 1 5, n 1 (1 f 1 ) 5 (1) n 2 30, n 2 f 2 5, n 2 (2 f 2 ) 5 (2) Dans ces conditions, sous l hypothèse H 0, on montre que la variable de décision Y définie par F 1 F 2 U = p1 (1 p 1 ) + p 2(1 p 2 ) n 1 n 2 suit une loi normale centrée réduite N (0, 1). Sous l hypothèse H 0, on réunit les deux échantillons et on estime p par la fréquence observée sur la réunion : ˆp = k 1 + k 2 n 1 + n 2 = n 1f 1 + n 2 f 2 n 1 + n 2 et on remplace p 1 et p 2 par ˆp dans le calcul de la variable U, autrement dit : f 1 f 2 U = ( 1 ˆp(1 ˆp) + 1 ) n 1 n Comparaison entre deux moyennes On étudie une variable aléatoire X dans deux populations P 1 et P 2. La moyenne et la variance de X sont µ 1 et σ 2 1 dans P 1, µ 2 et σ 2 2 dans P 2. Dans tout ce qui suit, on fait l hypothèse que les échantillons sont indépendants (il existe des tests pour les échantillons appariés mais on ne les traitera pas ici) Distribution normale On suppose dans ce paragraphe que la variable étudiée est distribuée selon une loi normale dans la population. L hypothèse nulle est : H 0 : µ 1 = µ 2, ou la différence entre x 1 et x 2 n est pas significative 9
10 Cas d un grand échantillon C est le cas où n 1 > 30 et n 2 > 30. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = X 1 X 2 σ1 2 + σ2 2 n 1 n 2 suit approximativement une loi normale centrée réduite N (0, 1). Les échantillons étant de grande taille, le même résultat reste valable si σ 2 1 et σ 2 2 ne sont pas connues et qu on les remplace par les variances estimées s 2 1 et s 2 2. Cas d un petit échantillon Si les échantillons sont extraits de populations gaussiennes et si σ1 2 et σ2 2 ont une même valeur σ 2 alors, sous l hypothèse H 0, on montre que la variable de décision T définie par T = X 1 X 2 σ 2 ( 1n1 + 1n2 ) suit une loi de Student à n 1 + n 2 2 degrés de liberté. Si σ 2 n est pas connu, on l estime au moyen de la formule : Distribution quelconque S 2 = (n 1 1)s (n 2 1)s 2 2 n 1 + n 2 2 Lorsque la variable étudiée n est pas distribuée normalement dans la population, on doit utiliser un test non paramétrique : dans le cas de 2 échantillons, on applique le test de Mann-Whitney et dans le cas de k échantillons ((k > 2) le test de Kruskal-Wallis. Ces deux tests ne font pas d estimation de la moyenne ou de la variance et ne prennent en compte que le rang des valeurs observées et non pas les valeurs ellesmêmes. Test de Mann-Whitney On considère deux échantillons, E 1 et E 2, d observations de la variable étudiée, de tailles respectives n 1 et n 2. On forme la réunion de ces deux échantillons et on l ordonne par ordre croissant. Pour chaque valeur x i de l échantillon E 1, on compte le nombre n xi de valeurs provenant de l échantillon E 2 qui sont supérieures à x i. On note u 1 la somme des n xi. On fait ensuite le même calcul à partir de l échantillon E 2 : pour chaque valeur y j de l échantillon E 2, n yj est le nombre de valeurs provenant de l échantillon E 1 qui sont supérieures à y j. On note u 2 la somme des n yj. La variable de décision est u = min(u 1, u 2 ) Si les échantillons sont petits, on lit la valeur critique c α correspondant au seuil α choisi dans des tables de Mann-Whitney (voir la table 2 p. 16). Si u est inférieure à c α, on rejette l hypothèse H 0 au risque α de se tromper. 10
11 Si les échantillons sont de taille supérieure à 20, la variable u suit approximativement une loi normale de moyenne et d écart-type µ = n 1n 2 n1 n 2 (n 1 + n 2 + 1) σ = 2 12 On cherche dans ce cas les valeurs critiques pour la loi N (µ, σ). Remarque : lorsque des valeurs sont identiques (ex-aequos), leur rang est remplacé par la moyenne des rangs correspondants : par exemple, si la 6ème et la 7ème valeur sont identiques, on considère que cette valeur correspond au rang 6,5. Test de Kruskal-Wallis La démarche est analogue à celle du test de Mann-Whitney. On considère k échantillons E 1,..., E k, d observations de la variable étudiée, de tailles respectives n 1,..., n k. On forme la réunion des k échantillons et on l ordonne par ordre croissant. Pour chaque échantillon E i, on calcule la somme r i des rangs occupés par les observations qui proviennent de lui. La variable de décision est : h = ( k ) 12 ri 2 3(N + 1) N(N + 1) n i=1 i avec N = k i=1 n i. Si les tailles n i sont supérieures à 5, la variable h suit (sous l hypothèse H 0 ) une loi du χ 2 à k 1 degrés de liberté. Sinon, il faut lire la valeur critique dans des tables de Kruskal-Wallis. Lorsque h h α, on rejette l hypothèse H 0. Remarque : lorsque k = 2, on retrouve le test de Mann-Whitney. Les quantités u 1 et u 2 de Mann-Whitney et les quantités r 1 et r 2 de Kruskal-Wallis sont reliées par les relations : r i = u i + n i(n i + 1) i = 1, Comparaison entre deux variances Avec les mêmes notations que dans le paragraphe précédent, on estime la variance des échantillons au moyen de s 2 1 et s 2 2. La question est de savoir si la différence entre s 2 1 et s 2 2 est significative ou simplement due aux fluctuations d échantillonnage. On note S 1 et S 2 les variables aléatoires qui prennent les valeurs s 1 et s 2 sur tous les échantillons de taille n 1 et n 2 respectivement. L hypothèse nulle est : H 0 : σ 2 1 = σ 2 2 Sous l hypothèse H 0 et si les deux populations P 1 et P 2 sont gaussiennes, on montre que la variable de décision F définie par F = S2 1 S 2 2 suit une loi de Fisher-Snedecor de paramètres (n 1 1, n 2 1). 11
12 Une loi de Fisher-Snedecor (appelée aussi loi du F ) possède deux paramètres ν 1 et ν 2 dits degrés de liberté. Les tables donnant les valeurs de ces lois sont à double entrée. Chaque table correspond à une valeur particulière du risque α. L ordre des paramètres ν 1 et ν 2 est important : les tables ne sont pas symétriques. On a la propriété suivante : si une variable aléatoire F suit une loi de Fisher-Snedecor à ν 1 et ν 2 degrés de liberté, alors 1 F suit une loi de Fisher-Snedecor à ν 2 et ν 1 degrés de liberté. Le calcul des bornes de la zone de rejet consiste à trouver deux nombres a et b tels que : P (F a) = α et P (F b) = α 2 2 Les tables pour une valeur r du risque donnent habituellement la borne u telle que P (F u) = r. On a donc besoin en principe des tables pour et si on veut α = Souvent, seule la valeur de b est calculée : en effet, les valeurs données dans les tables sont toujours supérieures à 1. Il suffit donc de s arranger pour ordonner les deux échantillons de telle sorte que s 2 1 > s 2 2 et la règle de décision est simplement : si s2 1 s 2 < b, on ne peut pas rejeter l hypothèse nulle H 0 ; 2 si s2 1 s 2 b, on rejette l hypothèse nulle H 0 avec un risque α de se tromper. 2 Mais il faut comprendre que cela signifie qu on opte pour un test unilatéral, autrement dit qu on postule que l hypothèse alternative est : H 1 : σ1 2 > σ2 2 Plutôt que de dépendre de l existence de tables appropriées, il est préférable d utiliser R pour calculer les bornes a et b. Dans R, la loi de Fisher-Snedecor est désignée par la lettre f. La fonction quantile se note donc qf et la fonction de répartition pf. Ces deux fonctions prennent en argument les deux degrés de liberté. Par exemple, au risque α = 0.05 avec des degrés de liberté ν 1 = 8 et ν 2 = 5 on trouve : > a=qf(0.025,8,5) > a [1] > b=qf(0.975,8,5) > b [1] Il existe aussi dans R une fonction var.test qui exécute directement le test de comparaison des variances de deux échantillons. Cette fonction possède un paramètre optionnel alternative qui permet de spécifier si on veut un test bilatéral ou unilatéral. Les valeurs possibles pour cette option sont : "two.sided", "less", "greater". Par défaut, c est un test bilatéral (two.sided) qui est exécuté. Exemple Un chimiste a effectué des dosages. Deux prélèvements ont été effectués et des mesures de concentration ont donné les résultats suivants : 12
13 Prélèvement 1 5,9 5,7 5,4 6,2 Prélèvement 2 5,7 5,9 4,5 6,1 4,6 Comparer la variabilité des erreurs entre les deux échantillons. On peut faire le calcul direct avec R comme ceci : > p1 <- c(5.9, 5.7, 5.4, 6.2) > p2 <- c(5.7, 5.9, 4.5, 6.1, 4.6) > var1 <- var(p1) [1] > var2 <- var(p2) [1] > F <- var1/var2 [1] La valeur critique à 5% est : > qf(0.95,3,4) [1] Puisque < , on accepte l hypothèse H 0. En faisant exécuter le test au moyen de la fonction var.test, on obtient : > var.test(p1,p2) F test to compare two variances data: p1 and p2 F = , num df = 3, denom df = 4, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances La p-valeur est supérieure au risque 0.05, ce qui conduit bien à accepter l hypothèse H 0. On retrouve directement la p-valeur comme ceci : > pf(f,3,4)*2 [1]
14 4.4 Comparaison entre deux coefficients de corrélation Le contexte est celui de deux populations P 1 et P 2 sur lesquelles on considère des couples de variables aléatoires (X 1, Y 1 ) et (X 2, Y 2 ) qui suivent une loi normale à deux dimensions. La liaison entre les variables X 1 et Y 1 dans la population P 1 est mesurée par un coefficient de corrélation (inconnu) ρ 1. De même, dans la population P 2, la corrélation est mesurée par ρ 2. On obtient des estimations r 1 et r 2 de ρ 1 et ρ 2 à partir d échantillons de tailles n 1 et n 2 respectivement. L hypothèse nulle est : H 0 : ρ 1 = ρ 2 autrement dit la différence entre r 1 et r 2 n est pas significative. Pour formuler plus facilement le test, on introduit les notations suivantes : z 1 = 1 ( log r1 ) et z 2 = 1 ( r 1 2 log r2 ) 1 r 2 et on note Z 1 et Z 2 les variables aléatoires associées. Sous l hypothèse H 0, on montre que la variable de décision U définie par U = Z 1 Z 2 1 n n 2 3 suit approximativement une loi normale centrée réduite N (0, 1) dès que n 1 et n 2 sont suffisamment grands ( 20). 14
15 5 Annexe 5.1 Table de Kolmogorov-Smirnov Seuils critiques D α (n) n α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = > / n 1.14/ n 1.22/ n 1.36/ n 1.63/ n TABLE 1 Table de Kolmogorov-Smirnov 15
16 5.2 Table de Mann-Whitney TABLE 2 Table de Mann-Whitney au seuil 5% 16
Introduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailTESTS D'HYPOTHESES Etude d'un exemple
TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailChapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailPackage TestsFaciles
Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détail1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailIFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailProbabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Plus en détailTests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailCNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailLimites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailProbabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen
Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailMESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .
MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision
Plus en détail4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détailApprentissage par renforcement (1a/3)
Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailLicence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Plus en détailÉpreuve collaborative
Épreuve collaborative Pour chaque partie, la grille permet d apprécier, selon quatre niveaux, les compétences développées dans le sujet par le candidat. Pour cela, elle s appuie sur des indicateurs traduisant
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16
ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailNombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Plus en détailProbabilités Loi binomiale Exercices corrigés
Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailTests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailM2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détail4 Distributions particulières de probabilités
4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailSTA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Plus en détailTS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S
FICHE Fiche à destination des enseignants TS 35 Numériser Type d'activité Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S Compétences
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailImage d un intervalle par une fonction continue
DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction
Plus en détailExposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez.
Test d homogéné$é Y. BRUNET-MORET Ingénieur hydrologue, Bureau Central Hydrologique Paris RÉSUMÉ Présentation d un test d homogénéi.té spécialement conçu pour vérijier Z homogénéité des suites chronologiques
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailTESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailClasse de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Plus en détailArrondissage des résultats de mesure. Nombre de chiffres significatifs
BUREAU NATIONAL DE MÉTROLOGIE COMMISSARIAT À L'ÉNERGIE ATOMIQUE LABORATOIRE NATIONAL HENRI BECQUEREL Note technique LNHB/04-13 Arrondissage des résultats de esure Nobre de chiffres significatifs M.M. Bé,
Plus en détailCorrection du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailMesures et incertitudes
En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire
Plus en détailMario Geiger octobre 08 ÉVAPORATION SOUS VIDE
ÉVAPORATION SOUS VIDE 1 I SOMMAIRE I Sommaire... 2 II Évaporation sous vide... 3 III Description de l installation... 5 IV Travail pratique... 6 But du travail... 6 Principe... 6 Matériel... 6 Méthodes...
Plus en détailLEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.
LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,
Plus en détail